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C: 穿越 时 空 的 迷雾 


C 诡异 离奇 ， 缺陷 重重 ， 却 获得 了 巨大 的 上 成功， 





Dennis Ritehie 


1 C 语言 的 史前 只 段 


上 昕 上 去 有 些 痪 雇 ，C 语言 的 产生 竟然 源 于 个 失败 的 项 日 。1969 年 ， 遂 用 电气 、 麻 省 理 
工学 院 和 贝尔 实验 室 联 合 创 交 了 一 个 庞大 的 项 悦 一 Multics 工程 。 该 项 日 的 日 的 是 创建 一 个 
操作 系统 ， 但 显然 遇 到 了 哄 烦 :， 它 不 但 无 法 交付 诛 先 所 承诺 的 快速 型 便捷 的 在 线 系 统 ， 甚 全 
连 一 点 有 用 的 东 由 部 没有 汶 出 来 。 虽 然 开发 小 组 最 终 勉 剖 让 Multics 开动 起 来 ， 但 他 们 还 是 
陷入 了 泥 济 ， 就 像 [BM 在 0S/360 上 面 … 样 。 他 们 试图 建立 一 个 非常 巨大 的 操作 系统 ， 能 够 
应 用 于 规模 很 小 的 硬件 系统 中 。Maultics 成 了 总 结 工程 教训 的 宝库 , 代 它 同时 也 为 C 语言 体现 
“小 即 是 英 ” 销 平 了 道路 ， 

当心 灰 意 冷 的 贝尔 实 玲 室 的 专家 们 撤离 Multics 工程 后 ， 他 们 又 去 寻找 其 他 任务 。 其 中 
-位 名 叫 Ken Thompson 的 研究 人 员 对 另 一 个 操作 系统 很 感 兴趣 ， 他 为 此 好 儿 次 向 贝尔 管 开 
屋 提 议 ， 但 均 遭 否决 。 夺 适 待 官方 批准 时 ，Thompson 和 他 的 同事 Dennis Ritchie 自 娱 白 乐 ， 
把 Thompson 的 “太空 旅行 ”软件 移植 到 不 太 常 用 的 PDP-7 系统 上 。 太 空 旅行 软件 模拟 太阳 
系 的 主要 星体 ， 把 它们 显示 在 图 形 屏 幕 上 ， 并 创建 了 一 架 航 大 飞机 ， 它 能 够 飞行 并 降落 到 各 
个 行 时 上。 与 此 同时 ，Thompson 加 紧 上 作 ， 为 PDP-7 编写 了 一 个 简易 的 新 型 操作 系统 。 它 
比 Multics 简单 得 多 , 也 轻便 得 多 。 整个 系统 都 是 用 汇编 语言 编写 的 。 Brian Kemighan 在 1970 
年 给 它 取 名 为 UNIX， 白 旱地 总 结 了 从 Multics 中 获得 的 那些 不 应 该 做 的 教训 。 图 1-1 描述 了 
早期 C、UNIX 和 相关 储 件 系 统 的 关系 。 


1965-7 1969 1971 1972-3 


操作 系统 


UNIX dH PDP-7 汇 UNIX :HPDP-11. | 
编 语言 颖 入 ) 编 洁 尚 编 i 


使 件 
. 
PD3-7 | PDP-1] | 
1BM 360 有 
| Honeywell 635 有 


图 1-1 早期 C、UNIX 各 树 美 的 三 件 系 统 


十 先 夺 C 语 言 还 是 先 有 UNIJX 呢 ? 说 起 这 个 问题 ， 人们 很 容易 陷入 先 有 鸡 还 是 尘 有 过 的 
伏 套 中 。 确 切 地 说 ，UNIX 比 C 语言 出 现 得 半 〈 这 也 是 为 什么 UNIX 的 系统 时 间 是 从 1970 
年 1 及 1 日 起 掖 秒 计算 的 ， 它 就 是 那 时 候 产 生 的 啊 }。 然 而 ， 我 们 这 里 讨 论 的 不 起 家 禽 趣 闻 ， 
和 而 是 编程 卜 事 。 用 汇编 语言 编写 UNIX 显得 很 笨拙 ， 在 编制 数据 结构 时 浪费 了 大 侍 的 时 间 ， 
而 且 系 统 准 以 调 诚 ， 理 解 起 来 也 很 国难 。Thompson 想 利用 高 级 语言 的 一 些 优点 ， 但 又 不 要 
像 PL/T 那样 效率 低下 ， 也 不 很 碰见 在 Multics 中 兽 遇 到 过 的 复杂 问题 。 在 用 Fortran 进行 了 -- 
羡 简 短 而 区 不 成 功 的 尝试 之 后 ，Thompson 创建 了 B 语言 ， 他 把 用 二 研究 的 语言 BCPL2 作 节 
简化 ， 使 B 的 解释 器 能 常 半 于 PDP-7 只 有 8KB 大 小 的 内 存 中 。B 语言 从 米 不 曾 趴 正成 功 过 ， 
内 为 鲁 件 系统 的 内 存 照 制 ， 它 只 允许 放 喷 解释 器 ， 而 不 是 编译 器 ， 出 此 产生 的 低 效 阻 从 了 使 
用 B 语音 进行 UNIX 自身 的 系统 编程 。 








UNIX 
(CC 编 13) 











” 学 习 、 使 用 和 实现 PL 的 困 准 使 - : 宛 黎 序 员 写 了 这 祥 -- 首 打油诗 : “IBM 有 个 PLA， 语 站 比 JOSS 本 糟 粒 ， 到 处 痢 见 它 竖 弦 ， 
实 实 人 在 作 是 二 级。JOSS 足 个 老 古 莫 ， 它 可 不 是 因 简 单 而 闻名 。"” 

” “BCPL: A Tool for Compiler Writing and System Programming (BCPL， 编 译 器 闹 攻 和 系统 编程 的 工具 ) ." Martin Richards Proe. 
AFIPS Spring Joint Computer Conference, 34(1969), pp.557-566. BCPL 并 “Before C Programming Language (C 前 里 编 称 语 言 1" 
的 首 字 全 缩写 ， 尽 管 这 是 个 有 趣 的 厅 合 。 它 的 确切 意思 是 “Basic Combined Programming Languapge《〈 基 本 组 合 编 得 话语 ” 
basic 的 意思 是 “不 蓄 哨 ”， 它 其 由 迹 国 伦敦 大 学 和 剑桥 大 学 的 研究 人 员 会 作 囊 发 的 。Multies 实现 了 -种 BCPI. 编译 器 。 
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在 编译 器 中 ， 效 率 几乎 就 是 一 切 。 当 然 还 有 一 些 其 他 需要 关心 的 东西 ， 如 有 意义 的 错误 
信息 、 良 好 的 文档 和 产品 支持 。 但 与 用 户 需 要 的 速度 相 比 ， 这 些 因素 就 点 然 失色 了 。 编 至 器 
的 效率 色 括 两 个 方面 : 运行 效率 (代码 的 运行 速度 ) 和 编译 效率 ( 产生 可 执行 代码 的 速度 ) . 
除了 一 些 开发 和 学 习 环 境 之 外 ， 运 行 效率 起 决定 性 作用 。 

有 很 多 编译 优化 措施 会 延长 编译 时 间 ， 但 却 能 缩短 运行 时 间 。 还 有 一 些 优 化 措施 【如 清 
除 无 用 代码 和 忽略 运行 时 愉 查 等 ) 即 能 缩短 编译 时 间 ， 又 能 减少 运行 时 间 ， 同 时 还 能 减少 内 
在 的 使 用 量 。 这 些 优化 措施 的 不 利之 处 在 于 可 能 无 法 发 现 程序 中 无 效 的 运行 结果 。 优 化 措施 
本 身 在 转换 代码 时 是 非常 谨慎 的 ， 但 如 果 程 序 员 编写 了 无 效 的 代码 (如 : 越过 数组 边界 引用 
对 象 ， 因 为 他 们 “知道 ”附近 有 他 们 需要 的 变量 ) 就 可 能 引发 错误 的 结果 . 

这 就 是 为 什么 说 效率 几乎 就 是 一 切 但 也 并 不 是 绝对 的 道理 。 如 果 得 到 的 结果 是 不 正确 
的 ， 那 么 效率 再 高 又 有 什么 意义 呢 ? 编译 器 设计 者 通常 会 提供 一 些 编译 器 选项 、 这 样 ， 每 个 
程序 员 可 以 选择 自己 想 要 的 优化 措施 . B 语言 不 算 成 功 , 而 Dennis Ritchie 所 创造 的 注重 效率 
的 “New B" 却 获得 了 成 苞 ， 计 分 证 明了 编译 器 设计 者 的 这 条 金 科 斑 律 ， 

B 语言 通过 省 略 一 些 ' 圭 性 【如 嵌 僚 过 程 和 -- 些 循环 结构 )， 对 BCPL 语言 作 了 了 简化， 并 发 
扬 了 “引用 数组 元 素 相当 十 对 指针 加 上 偏 移 量 的 引用 ”这 个 想法 。B 诸 音 同时 保持 了 BCPL 
语言 无 类 型 这 个 特点 ， 它 尺 有 的 操作 数 就 是 机 妙 的 子 。Thomposon 发 明了 ++ 和 -- 操 作 符 ， 并 
把 它 加 入 到 PDP-7 的 B 编译 器 中 。 它 们 在 C 语言 由 依然 存在 ， 很 多 人 天 真 地 以 为 这 是 由 于 
PDP-11 存在 对 应 的 目 动 增 / 减 地 址 模型 ， 这 种 想法 是 错误 的 ! 白 动 增 / 减 机 制 的 出 现时 于 
PDP-]1 硬件 系统 的 出 现 。 尽 管 在 C 语 吝 中 ， 挡 贝 字符 捉 中 的 一 个 宁 符 的 语句 : 

“D++ = yy 号 + 十 了 
可 以 极其 有 效 地 被 编译 为 PDP-11 代码 : 

moveb (rO)+, (rl})+ 

这 使 得 许多 人 错 谋 地 以 为 前 者 的 语句 形式 是 根据 后 者 特意 设计 的 。 

当 1970 年 开发 平台 转移 到 PDP-11 以 后 ， 无 类 型 语言 很 快 就 显得 不 合 时 宜 了 。 这 种 处 理 
器 以 硬件 文 持 儿 种 不 同 长 芝 的 数据 类 型 为 特色 ， 而 了 语言 无 法 表达 不 同 的 数据 类 型 。 效 率 也 
是 个 问题 ， 这 也 迫使 TrFompson 在 PDP-11 上 重新 用 汇编 语 车 实现 了 UNIX。Dennis Ritchie 
利川 PDP-11 的 强人 人 性能， 创立 了 能 够 同时 解决 多 种 数据 类 型 和 效率 的 “New B”( 这 个 名 字 
很 快 此 成 了 “C2?) 请 吝 ， 它 末 川 了 编译 模式 而 不 是 解释 模式 ， 并 引入 类 型 系统 ， 每 个 家 呈 
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和 在 使 用 前 必须 先 声 骨 。 


1.2 C 语言 的 早期 体验 


增加 类 型 系统 的 主要 目的 是 帮助 编 详 器 设计 者 区 分 新 型 PDP-11 机 器 所 拥有 的 不 同 数 据 
类 型 ， 如 单 精度 浮 点 数 、 双 精度 浮 点 数 和 字符 等 。 这 与 其 他 一 些 语 冶 如 Pascal 形成 了 鲜明 的 
对 比 。 在 Pascal 沾 ， 类 型 系统 的 目的 是 保护 程序 员 ， 防 王 他 们 在 数据 上 进行 无 效 的 操作 。 由 
于 奴 计 哲学 不 同 ，C 语言 排斥 蝇 类 型 ， 它 允许 程序 员 需 要 时 可 以 在 不 同类 型 的 对 象 间 赋 值 . 
类 型 系统 的 加 入 可 以 说 古本 后 诸葛 ， 从 未 在 可 用 性 方面 进行 过 认真 的 评估 和 严格 的 测试 ， 时 
至 今日 ， 许 多 C 程序 员 仍然 认为 “ 强 类 型 ”只 不 过 是 增加 了 敲 击 键盘 的 :无 用 功 。 

除了 类 型 系统 之 外 ,上 语言 的 许多 其 他 特性 是 为 了 方便 编 详 器 设计 者 而 建立 的 (为 什么 
不 呢 ? 开始 几 年 C 诸 言 的 主要 客户 就 是 那些 编译 器 设 订 者 啊 )。 根 据 编 详 器 设计 者 的 电路 而 
发 展 形成 的 语言 特性 有 : 

”数组 下 标 从 0 而 不 喷 1 开始 。 绝 大 多 数 人 习惯 从 1 而 不 是 0 开始 计数 . 编译 器 设计 省 
则 选择 从 0 吓 始 ， 因 为 偏 秘 基 的 概念 在 他 们 心中 已 是 根深 蒂 固 。 人 9 这 种 设计 让 一 般 人 感觉 很 
判 握 。 尽 管 我 们 定义 了 一 个 数组 a[100]， 你 可 千 万 草 往 a[100] 蛙 存储 数据 ， 内 为 这 个 数组 的 
合法 范围 是 从 a[0] 到 a[99]。 

，C 语言 的 基本 数据 类 型 直接 与 底层 硬件 相对 应 。 人 和 例如， 不 像 fortran，C 语言 中 不 存 
代 内 堵 的 复数 类 型 。 某 种 语言 要 素 如 果 底 层 硬 件 没有 提 作 直接 的 支持 ， 那 么 编译 器 设计 者 就 
不 会 在 它 上 向 浪费 仔 何 精力 。C 诸 言 一 开始 并 不 支持 浮 点 类 卉 ， 贞 到 使 件 系统 能 够 衣 接 支持 
浮 点 数 之 后 才 增 加 了 对 它 的 支持 。 

， auto 关键 字 显 然 是 摆设 。 这 个 关键 字 只 对 创建 符号 表 入 口 的 编 诺 器 设计 者 有 意义。 
它 是 意思 是 “在 进入 程序 块 时 自动 进行 内 存 分 配 ”( 与 全 局 静态 分 配 或 在 堆 二 动态 分 配 相反 》， 
其 他 程序 员 不 必 操 心 auto 这 个 关键 字 ， 它 是 缺 省 的 变量 内 存 分 配 模式 。 

”表达 式 中 的 数组 名 可 以 看 作 是 指针 。 把 数组 当 作 指针 ， 简 化 了 很 多 和 所 两 。 我 们 不 再 宕 
要 一 种 复杂 的 机 制 区 分 它们 ， 把 它们 传递 到 -- 个 函数 时 不 必 忍 受 必须 复制 所 有 数组 内 容 的 低 
效率 。 不 过 ， 数 组 和 指针 并 不 是 住 任何 情况 下 都 是 等 效 的 ， 更 详细 的 装 论 参见 第 4 前。 

” fioat 被 自动 扩展 为 double。 尽 管 在 ANSI C 中 情况 不 再 如 此 ， 介 最初 浮 点 数 常量 的 
精度 都 臣 double 型 的 ， 记 有 表达 式 中 float 变量 总 被 自动 转换 成 double。 这 样 做 的 理由 从 木 
公 诸 于 众 ， 但 它 与 PDP-11 中 浮 点 数 的 三 件 表示 方式 有 关 ， 首 先 ， 在 PDP-11 或 VAX 中 ， 从 
float 转换 到 double 代价 非 澡 小 ， 只 要 在 后 面 增 加 一 个 每 个 位 均 为 0 的 字 即 可 。 如 果 杰 转换 加 | 
来 ， 去 掉 第 “个 字 就 可 以 了 。 其 次 ， 要 知道 在 某 些 PDP-11 的 浮 点 数 硬 件 表示 形式 中 有 --- 个 
运算 模式 位 (mode bib， 你 可 以 只 进行 float 的 运算 ， 也 可 以 只 进行 double 的 运算 ， 但 如 果 想 
在 这 两 种 方式 问 进行 切换 ,就 必须 修改 这 个 位 来 改变 运算 模式 。 在 早期 的 UNTX 程序 中 ,float 
用 得 不 是 太 多 , 所 以 把 运算 借 式 固定 为 double 是 比较 方便 的 , 省 得 编译 器 设计 者 去 跟踪 它 的 
变化 。 
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”不 允许 嵌 套 函数 〈 范 数 内 部 包含 另 一 个 项 数 的 定义 )。 这 人 条 化 了 网 详 器 ， 并 稍微 提 总 
了 CC 程序 的 运行 时 组织 结 欧 。 具 体 的 机 理 在 第 6 章 “ 运 动 的 诗 章 ， 运行 时 数据 结构 ”详细 
描述 。 

。 register 关键 字 。 这 个 关键 字 能 给 编译 器 设计 背 提 供 线 索 ， 就 是 程序 的 蛙 些 变量 属 
于 热门 ‘经常 被 使 用 )， 这 样 就 可 以 把 它们 存放 人 到 寄存 口中。 这 个 设计 可 以 说 是 一 个 失 议 ， 如 
打 计 编译 器 什 使 用 各 个 变 其 时 和 白 动 处 理 寄存 器 的 分 配 上 作 ， 电 然 比 一 经 声明 束 瓜 这 类 变量 在 
生命 期 内 始终 保留 在 寄存 器 甘 要 好 。 使 用 register 关键 字 , 简化 了 编 详 器 ， 却 把 包 挫 于 给 了 积 
序 员 。 

为 了 C 编 详 占 汰 计 者 的 方便 而 建立 的 其 他 语言 特性 运 有 很 多 。 这 本 身 不 是 - - 件 坏 事 ， 它 
人 人 简化 了 C 语 吾 本 身 ， 而 且 通 过 回避 一 些 复 杂 的 语 记 要 素 〈 旭 Ada 由 的 泛 型 和 任务 ，PLH 
中 的 字符 出 处 理 ，C++O 的 模板 和 多 重 继承 )，C 请 言 见 容易 学 半 和 实现 ， 而 县 效率 非常 疝 。 

和 其 他 大 多 数 语 诗 不 同 ，C 语言 右 一 个 漫长 的 进化 过 程 。 在 外 前 这 个 形式 之 前 ， 它 经 方 
了 许多 中 间 状 态 。 它 历经 洛 年 ， 从 一 个 实用 工具 进化 为 - -种 经 过 大 其 试验 和 测试 的 庄 言 。 第 
一 个 C 编译 右 大 约 出 现在 1970 年 , 由 今 20 多 年 了 . 时 光 佳 蕊 ， 作 为 它 的 根基 的 UNIX 系统 
得 到 了 广泛 使 用 ，C 语言 也 随 之 荔 壮 成 长 。 它 尘 站 接 几 硬件 支持 的 底层 操作 的 强调 ， 带 来 了 
极 剖 的 效 阐 利 移 植 性 ， 反 过 来 也 帮助 UNIX 获得 了 巨人 的 成 动 ， 


1.3 标准 IO 库 和 C 预 处 理 器 


C 编 详 器 不 曾 实现 的 “: 些 功能 必须 通过 其 他 途径 实现 - 在 C 说 凑 中， 它们 在 运行 时 进行 
处 型 ， 既 可 以 出 现在 应 用 涅 序 代 码 中 ， 也 可 以 出 现在 运行 时 沙 数 库 (runtime library) 中 。 在 许 
多 其 他 庄 言 中 ， 编 译 器 会 圭 入 一 些 代 码 ， 隐 式 地 调 扩 运行 时 支持 了 上 其， 这样 程序 员 就 无 须 操 
心 它们 了 。 但 在 C 语 诗 中 , 绝 大 多 数 库 函数 或 辅助 程序 都 需要 显 式 调用 ,。 例如， 在 诸 言 中 
(必要 时 )， 程 序 员 必须 管理 动态 内 存 的 使 用 ， 创 建 各 种 大 小 的 数组 ， 淹 试 数 组 边界 ， 阁 自已 
进行 范围 检测 。 

与 此 类 似 , C 读 言 原先 并 没有 定义 11O, 而 是 由 库 汤 数 提供 。 后 米 ， 这 实际 上 成 了 标准 机 
制 。 可 移植 的 WO 由 Mike Lesk 编写 ， 最 初出 现在 1972 年 左右 ， 可 在 当时 存在 的 .3 个 平台 上 
道 用 。 实践 经 验 表 明 ， 它 钓 性 能 低 于 预期 值 。 所 以 ， 人 们 对 它 义 进行 了 优化 和 裁 前 ， 后 来 成 
为 林 准 LO 函数 库 。 

C 预 处 理 器 大 约 也 是 本 这 个 时 候 被 加 入 的 ， 倡议 者 是 Alan Snyder。 它 所 实现 的 3 个 主要 
功能 是 ， 

。 字符 串 奉 换 : 形式 类 似 “ 把 所 有 的 foo 替换 为 baz”， 通常 用 于 为 常量 提供 … 个 符号 名 。 

。 头 文件 包含 〈 这 是 在 BCPL 中 首创 的 )，- - 般 性 的 声明 可 以 被 分 离 到 头 文件 中 ， 并 且 
可 以 被 首 多 源 文件 合 用。 虽然 约定 采用 “.h” 作 为 头 文件 的 扩展 名 ， 但 在 头 文件 和 包含 实现 


， 本 书 原版 出 本 1994 年 ， 当 时 距 1970 年 还 椒 狠 30 年 。 一 洋 洗 注 
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代码 的 对 象 库 之 间 在 命名 上 邯 没 有 柑 应 的 约定 ， 这 多 少 今 人 不 快 。 

* 通用 代 友 模板 的 扩 轩 。 与 函数 不 同 ， 宏 (marco) 在 连续 儿 个 调用 中 所 接 和 收 的 参数 的 类 
型 可 以 不 同 ( 宏 的 实际 参数 愉 是 按照 原样 输出 )。 这 个 特性 的 加 入 比 前 两 个 稍 晚 ， 而 且 多 少 最 
得 有 些 秆 拙 。 在 宏 的 扩展 中 ， 罕 格 会 对 扩展 的 结果 造成 很 大 的 影响 。 


#4define aly) a_expandedt{y) 
alx): 


被 扩展 为 : 

a_expanded (x}， 
而 : 

#define a fy) a_expanded {y)} 

alx); 
则 被 扩展 为 ; 

(y) a_expanded ly) {x) 

它们 万 表示 的 意思 风 和 牛马 不 相 及 。 你 可 能 会 以 为 栗 宏 是 面 使 用 花 括 号 就 像 在 C 语言 的 其 
他 部 分 一 样 ， 能 把 多 条 语句 组 合成 一 条 复合 语句 ， 但 实际 上 并 非 如 此 。 

这 失 对 CC 语 记 的 预 处 理 器 江 不 作 太 多 的 讨论 。 这 反映 了 这 样 一 个 观点 ， 对 于 宏 这 样 的 搞 
处 理 有 器 ， 只 应 该 适量 使 用 ， 所 以 无 须 深入 讨论 。C++ 在 这 方面 引入 了 一 些 新 的 方法 ， 使 得 预 
处 理 器 儿 乎 无 用 武之 地 。 








C 并 非 Algol 


70 年 代 后 期 ，Steve Bourme 在 贝尔 实验 室 编 写 UNIX 第 7 版 的 shell { 命令 解释 器 ) 时 ， 
决定 采用 C 预 处 理 器 使 C : 洛 言 看 上 去 更 像 AlgolL-68， 早 年 在 英国 剑桥 大 学 时 ，Stevc 兽 编 写 
过 一 个 Algol-68 编译 器 .他 发 现 如 果 代 码 中 有 显 式 的 “结束 语句? 提示 ,诸如 证 ,万 或 者 case .. 
esac 等 ， 调 试 起 来 会 更 容易 。Steve 认为 仅仅 一 个 “j” 是 不 够 的 ， 因 此 他 建立 了 许多 预 处 理 
定义 : 

#define STRING char * 
#4efine IF IE 
#riefine THEN }: 
#Qefine ELSE }e..sel 
#4define FI ;} 

#define WHILE whilet 
#3define DO }{ 
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sdefire OD 了 
#define TNT ir:t 
#Gerine RFGIN { 
Hanisine FND } 


这 样 ， 他 就 可 以 像 下 面 这 样 编写 代码 : 


INT comparclsl, s2) 
STRING si1} 
STRING s2; 
RESIN 
WHILE *Ssl++r == 所 了 
DO IF *S2++ == 
. THEN return(0}):; 


FE 
aD 
returnt*--sl - *as2); 
END 
再 看 一 下 相应 的 C 代 码 : 


II COIPare(S ，S2) 
Cnar *sl, *'32; 


{ 
whilel*sl++ == *S2)1{ 
ifl*e2++ == 0) return(d}); 
} 
returrn {*--s1i - xS2) ， 
} 


Bourne shell 的 影响 远 远 超 出 了 贝尔 实验 富 的 范围 ， 这 也 使 得 这 种 类 似 Algol-68 的 C 语 
言 变 型 名 声 大 品 。 但 是 ,有些 C 程序 员 对 此 感到 不 满 。 他 们 抱 她 这 种 记 法 使 别人 难以 维护 代 
码 。 时 至 今日 ，BSD 4.3 Boume shell (保存 于 /binish ) 依然 是 这 种 记 法 写 的 ， 

我 有 一 个 特别 的 理由 去 对 Bourne Sheltf， 在 我 的 书桌 上 堆 满 了 针对 它 的 Bug 报告 ! 我 把 
它们 发 给 Sam， 我 们 都 发 岗 了 这 样 的 Bug: 这 个 shell 不 使 用 malloc， 而 是 使 用 sbrk 自行 负 
责 堆 存储 的 管理 。 在 维护 这 类 软件 时 ,每 解决 两 个 问题 通常 又 会 引入 一 个 新 闻 题 ，Steve 解释 
说 他 之 所 采用 这 种 特制 的 内 存 分 配器 ， 是 为 了 提高 字符 串 处 理 的 效率 ， 他 从 来 不 曾 想到 其 他 
人 会 阅读 他 的 代码 。 








Bourne 创立 的 这 各 © 语言 事实 上 促成 了 蜡 想 天 于 的 国际 C 诸 言 混乱 代码 大 赛 〈The 
International Obfuscated C Code Competition)， 比 赛 要 求 参 赛 的 程序 员 尽 可 能 二 编写 神秘 而 泥 
乱 的 程序 米 压倒 对 于 (关于 这 个 比赛 ， 以 后 还 有 更 详尽 的 说 明 )，。 

宏 最 好 只 用 于 命名 常量 ， 并 为 一 些 适当 的 结构 提供 简捷 的 记 法 。 宏 名 应 该 大 写 ， 这 样 使 
很 容易 与 函数 调用 区 分 开 来 。 千 万 不要 使 用 C 预 处 理 趴 米 修改 语言 的 基础 结构 ， 因 为 这 样 一 
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来 C 语言 就 不 特 是 C 诗 计 了。 


1.4 K&RC 


到 了 20 世纪 70 年 代 中 期 ，C 语言 已经 很 接近 日 前 这 种 我 们 所 知道 利 江 爱 的 形式 了 。 册 
多 的 改进 仍然 存在 ， 但 大 部 分 都 只 起- -此 细节 的 变化 比如 允许 函数 返回 结 构 值 ) 利 一些 对 
基 木 类 型 进行 扩 o 民 以 天 应 新 的 硬件 变化 的 改进 。{ 比 如 增加 关键 unsigned 利 Jong)。1978 
年 ，Steve Johnson 编写 卫 Pee 这 个 可 移植 的 C 编 详 涡 。 它 的 源 代 码 对 让 尔 实 验 室 之 外 于 让 ， 
并 被 广泛 移植 ， 形 成 了 整整 一 代 C 编 详 器 的 基础 。C 党 童 的 演化 之 路 如 网 1-2 所 未 。 


1972-3 1976 心 1983-9 


二 | 下 期 人 鸭 C 


1947 


i Simu:a 87 六 











一 个 非 比 寻常 的 Bug 

C 语言 从 Algol-68 中 继承 了 一 个 特性 ， 就 是 复合 赋值 符 。 它 允许 对 一 个 重复 出 现 的 操作 
灼 只 写 一 次 而 不 是 两 次 ， 给 代码 生成 器 一 个 提示 ， 即 操作 数 寻 址 也 可 以 类 似 地 紧 姿 ， 这 方面 
的 一 个 例子 是 用 b+=3 作为 b=b+3 的 缩写 。 复 售 赋 值 符 最 初 的 写法 是 先 写 赋 值 符 ， 再 写 操作 
符 ， 就 像 : b=+3。 在 了 语言 的 词法 分 析 器 里 有 一 个 技巧 ， 使 实现 =op 这 种 形式 要 比 实现 目前 
所 使 用 的 op= 形 式 更 简单 一 些 。 但 这 种 形式 会 3 起 混 清 ， 它 很 容易 把 

b=-3; /* 从 b 中 减 去 3 */ 

和 

= -3; /* 把 -3 贼 给 D */ 

摘 混 消 . 

因此 ， 这 个 特性 被 修改 为 目前 所 使 用 的 这 种 形式 。 作 为 修改 的 一 部 分 ， 代 码 格式 器 程序 
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缩 进 也 作 了 相应 和 修改， 用 于 确定 复合 赋值 蔡 的 过 时 形式 ， 并 交换 两 者 的 位 置 ， 把 它 转 换 为 对 
应 的 标准 形式 ， 这 是 个 非常 糟 粒 的 决定 ， 任 何 增 式 器 都 不 应 该 修改 程序 中 除 室 白 之 外 的 任何 
东西 ， 令 人 不 快 的 是 ， 这 种 做 法 会 引入 一 个 Bug， 就 是 几乎 任何 东西 {只 要 不 是 变量 1 ， 如 
果 它 出 现在 赋值 符 后 面 ， 碗 会 与 赋值 符 交 撞 位 置 ， 

如 果 你 运气 好 ， 这 个 Bug 可 能 会 引起 语法 错误 ， 如 : 

cpzsilon=-0001; 

会 被 交换 成 : 

epcilon, -D000N1, 

这 条 语句 将 无 法 通过 编译 器 ， 你 蕊 上 就 能 发 现 错误 ， 但 一 条 源 语 自 也 可 能 是 这 样 的 : 

valve=!open;  /*valve 被 设置 为 open 的 记 加 反 */ 

会 悄 无 声息 地 交换 成 ， 

valve!=open; /syalve 与 upen 进行 不 相等 比较 *y 

这 条 语句 同样 能 够 通过 编译 ， 但 它 的 作用 与 源 语 向 明显 不 同 ， 它 并 不 改变 valve 的 值 ， 

在 后 面 这 种 情况 下 ， 这 个 Bug 会 潜伏 下 来 ， 并 不 会 被 马上 检测 到 。 在 距 值 后 面 加 入 空格 
旦 很 自然 的 事 ， 所 以 随 着 复合 典 值 符 的 过 时 形式 越 来 越 军 见 ， 人 们 也 逐渐 忘记 了 缩 进 曾经 被 
用 于 “改进 ”这 种 过 时 的 形式 。 这 个 由 缩 进 引起 的 Bug 直到 20 世纪 80 年 代 中 期 才 在 各 种 CC 
编译 竞 中 销声匿迹 。 这 是 -一 个 应 被 竖 决 据 弃 的 东西 ! a 

1978 年 ，C 诸 府 经 典 冯 著 The C Programming Language 出 版 了 。 这 本 蔬 受到 了 上 泛 的 赞 
誉 ， 其 作者 Brian Kemighan 和 Dennis Ritchie 也 因此 名 声 大 品 ， 所 以 这 个 版 本 的 C 语言 就 被 
称 为 “K&R C”。 出 版 商 最 初 估 计 这 本 书 将 售 出 1000 册 左 右 ， 截 止 色 1994 年 ， 这 本 书 大 约 
售 出 了 150 万 册 《〈 参 见 图 -3)。C 语言 成 为 最 近 20 年 最 成 功 的 编程 语言 之 一 ， 可 能 就 是 最 成 
功 的 。 但 随 着 C 语言 的 广泛 流行 ， 许 多 人 试图 从 C 语言 中 产生 其 他 变种。 


| Amda.1] | 
Burroughs 
去 持 忆 语言 的 丹 件 系统 从 A 到 世 都 存 在 
Cray 


习 1-3 像 猫 王 从 尔 维 斯 “ 样 ，C 语言 无 处 不 在 


1.5 今日 之 ANSEC 


介 了 20 此 纪 80 年 代 初 ，C 衣 关 被 业界 广泛 使 用 ， 作 让 在 许多 不 阿 的 实现 和 基 唱 PC 的 
实现 者 友 现 了 C 语 谱 优 于 BASIC 的 诸多 长 处 ， 这 一 发 现下 是 掀起 耻 C 请 让 的 疝 淹 、Mjrosoft 
为 IBM PC 制作 了 个 CC 编译 器 ， 引 入 了 几 个 新 的 关键 学 《far near 等 ) 帮助 指针 处 理 Intel 
80x86 已 昨 不 规则 的 桨 构 ， 随 各 其 他 更 多 并 非 基 十 pec 的 编译 器 的 兴起 ，C 请 二 受 到 了 重复 
BASIC 老路 的 威胁 ， 也 就 许可 能 变 成 一 种 多 个 变种 松散 村 关 的 语 计 。 

形势 渐渐 时 了， “个 天 式 的 庄 兰 标准 是 必需 的 。 地 过 的 是 ， 丰 :这 个 领域 忆 经 有 了 相 汉 多 
的 先行 者 一 一 所 有 成 切 的 编程 语言 最 终 都 作 了 标准 化 , 然而 , 编写 标准 手册 所 存在 的 问题 是 ; 
只 有 当 你 明白 它们 讲 的 十 什 么 ， 闭 才 是 可 行 的 如果 大 们 用 日 常 语 襄 米 编写 它们 ， 越 根 把 它 
们 咏 得 精确 ， 就 越 可 能 使 它们 灾 得 元 长 、 三 味 二星 梁 。 如 果 肝 数学 概念 来 定义 语言 ， 璇 么 标 
准 于 肌 对 十 人 多 数 人 而 言 不 当 丁 天书， 

多 秆 以 米 , 败 于 定义 编程 语 寺 标准 的 于 册 安 得 越 来 研 长 , 但 也 越 米 越 窑 切 夫 解 。Algol-60 
就 语言 复杂 性 而 言 ， 与 C 语言 不 相 上 小 ， 但 它 的 标准 于 如 一 一 Algol-60 Reference Definition 
内 在 18 页 .Pascal 用 了 35 义 来 描述 。Kernignan 和 Ritehie 所 作 的 C 语言 最 初 报告 川 了 40 页 ， 
心 管 漏 掉 了 些 东 西 ， 但 对 于 许多 编译 器 变 计 者 而 音 ， 这 些 已 经 足够 了 了。 定义 ANSI C 的 于 
册 超 过 了 200 页 。 它 部 分 地 对 C 语言 的 实际 应 月 作 了 描述 ， 是 对 标准 文档 中 有 些 晓 沉 交 学 的 
补充 各 说明， 

1983 年 ， 美 轩 困 家 标准 化 组 织 (ANSD 成 YY 了 CC 语 主 工作 小 组 ， 下 如 了 CC 语言 的 标准 化 
小 作 。 小 组 所 处 理 的 主 此 看 务 是 确认 C 语言 的 常用 特 凰 ， 但 对 诸 兰 本身 也 作 了 了 -- : 些 修改 ， 并 
引入 - 些 有 意义 的 新 特性 ， 对 于 是 否 要 接受 near 利 | far 关键 字 ， 小 组 内 部 进行 了 旷日持久 的 
争论 。 最终， 它们 还 是 没 契 被 纳入 以 UNIX 为 由 心 的 相对 谨慎 的 ANSLC 标准 。 尽 管 当 上 志 
界 上 大 约 有 5000 万 舍 PC， 而 内 它 是 当时 应 用 范围 最 广 的 C 诸 言 实现 平台 ， 但 标准 仍然 认为 
“我 们 认为 这 是 对 的 ) 不 应该 通过 修改 语言 来 处 理 某 个 特定 平台 所 存在 的 限制 ， 





yg 小 局 发 


该 用 哪个 版 本 的 C 语言 呢 ? 
就 此 而 论 ， 任 何 学 习 或 使 用 CC 语言 的 人 都 应 当 使 用 ANSI C， 而 不 是 K&R C 
Mt a OE Rn 








RAAT umrrereev 


1989 年 12 万 ，C 语言 标准 草案 最 终 被 ANSI 委员 会 接纳 。 随 后 ， 国 际 标准 化 组 织 ]SO 
也 接纳 了 ANSI C 标准 〈 令 人 不 快 的 是 ， 它 删除 了 非常 有 用 的 “Rationale” 一 - 节 ， 并 作 了 个 
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so 和 

组 织 ， 从 技术 上 上 讲 它 更 权 或 : 些 。 所 以 在 1990 年 初 ，ANSI 平 新 采纳 了 ISO C 《同样 删除 了 
Ri RN 内 此 从 原则 上 说 ， ANSIJ 所 采纳 的 和 请 专 标 准 是 ISO C， 我 
有 || 常 所 说 的 标准 C 也 应 该 是 ISO C。Rationale 这 一 节 臣 非常 有 所 的 ， 能 极 大 地 玫 助 人 和 们 理 
解 标准 ， 它 后 米 作 为 独立 的 文档 出 版 。” 





哪里 能 得 到 C 语言 标 , 舍 的 一 份 拷贝 


C 语言 标准 的 官方 名 浆 是 : ISO/IEC 9899:1994。1SO/IEC 是 指 国 Bn 际 电 
工 组 织 。 标 准 组 织 定价 $130.00 出 售 C 语言 标准 。 在 美国 ， 你 可 以 通过 给 下 面 的 地 址 写 信 和 
获取 一 份 标准 的 拷贝 
American National Standards Institute 
1L West 422 Street 
New York, NY 10036 


Tel(212)642-4900 
在 美国 以 外 的 地 区 ， 尔 可 以 向 下 面 的 地 址 写 信和 求购 : 
ISO Sules 


Case postale $56 

CH-1211 Genave 20 

Switzerland 

要 指明 自己 想 要 的 是 英语 版 本 。 

为 一 个 办 法 是 购买 Herbert Schildt 所 著 的 The Anootafed ANSIC Standard ( 纽约 ，Osbome 
McGraw-Hill,1993 ) , 这 本 书包 含 一 个 压缩 了 版 面 , 但 内 容 完整 的 CC 语言 标准 . Herbert Schildt 
的 书 有 首先 是 价格 ，$39.95 的 定价 不 到 标准 定价 的 三 分 之 一 。 其 次 ， 不 像 ANSI 
或 ISO， 它 可 能 在 你 当地 的 书店 里 就 有 售 ， 你 可 以 利用 20 世纪 的 先进 手段 ， 通 过 电话 订购 和 
信用 卡 和 和 什 


-~ 





实际 上 ， 件 ISO 成 立 第 14 下 作 小 组 (WG14) 制 定 C 标准 之 前 ，“ANSI C” 这 个 称呼 就 岂 


”ANSILC Rationale (单独 ) 1 通过 汇 名 FTP， 从 ftp.uu.net 下 载 ， 位 于 /docfstandardsyansirX3.159-19897 【如 果 你 本 明白 晓 名 FTP， 


直 紧 到 附近 的 书店 买 “本 关于 Intwmet 的 书 , 免得 成 为 信 息 高 速 公 路 二 的 “ 踊 行 的 荣 玉 ”Rationale 的 纸 版 书 也 已 出 版 ，4NST 
C Rationale， 灶 泽 内 Silicon Press.1990. ANSIC 标准 木 身 无 法 从 任何 ftp 站 点 下 载 ， 因 为 标准 印 剧本 的 荷 业 上 收入 是 ANSI 的 重 
要 收入 米 源 之 …。 
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被 六 泛 使 用 。 这 并 没有 什么 不 受 ， 因 为 ISO 十 作 小 组 把 最 初 标准 交 技 术 性 完善 .上 作 留 给 
ANSIX3J11 委员 会 。 企 工作 接近 尾声 时 ，JSO WG14 和 X3J11 一 起 遂 力 协作 ， 上 敲定 技 术 纲 节 
并 确保 最 终 的 标准 能 被 两 个 组 织 共 同 接受 。 事 实 上 ， 标 准 的 最 终 形成 又 推 返 了 一 企 ， 士 要 大 
为 了 修改 标准 草案 以 芒 盖 -: 些 国际 化 的 问题 如 窜 字 符 和 国际 区 域 问题 。 

这 就 依 得 所 有 几 年 来 -- 直 关心 C 诸 言 标准 能 人 们 将 新 的 标准 汉 成 是 ANSI C 标准 。 沿 语 
言 标准 最 终 形 成 后 ， 所 有 人 都 想 支持 C 诸 言 标准 。ANS1C 问 时 是 一 个 欧洲 标准 [CEN 29899) 
利 XiOpen 标准 。ANSIC 被 采纳 为 Federal Information Processing Standard〔( 联 郑 信息 处 理 标 
准 )， 取 名 FlPS160， 凡 国家 标准 和 技术 局 了 1991 年 3 月 发 布 ， 并 于 1992 第 8 月 24 上 更 新 . 
在 C 语 妾 上 的 工作 仍 在 继 红 一 一 据说 有 可 能 在 C 语言 中 增加 人 复数 类 型 。 


1.6 “” 它 很 榜 ， 但 它 符 合 标 准 吗 


不 要 条 乱 -一 -立即 解散 1SO 工作 小 组 . 





一 经 各 人 天 


ANSIC 标准 可 以 说 是 非常 独特 的 ,我们 可 以 从 好 几 个 有 趣 的 方面 来 说 明 这 -点 。 它 定义 
了 下 止 一些 术 诸 ， 用 于 描述 某 种 编 详 器 的 特点 。 如 果 你 对 这 些 术语 有 : -个 比较 好 的 了 解 ， 就 
有 助 于 你 理解 什么 东 目 能 链 语 言 接受 ， 什 么 东西 不 能 被 语言 接受 。 前 两 个 术语 涉及 不 可 移 村 
的 代码 (unportable code)， 接 下 来 的 两 个 术语 跟 坏 代码 (bad code) 有 关 ， 人 而 最 后 两 个 术语 则 跟 可 
移植 的 代码 (portable code) 有 关 - 

不 可 移植 的 代码 frunpoltable code); 

由 编 详 器 定义 的 (implementation-defined) 一 一 由 编译 器 设计 者 决定 采取 人 和 何 种 行动 《就 是 
说 ， 在 不 同 的 编译 器 中 所 节 取 的 行为 可 能 并 不 相同 ， 但 它们 都 是 正确 和 的 )， 并 作 好 文档 记录 。 

例如 : 当 整 型 数 向 右 移 位 时 ， 要 不 要 扩展 符号 位 。 

未 确定 的 (unspecified)- 一 在 某 些 正 确 情况 下 的 做 法 ， 标 准 并 未 明 梢 规定 应 该 怎样 做 . 

例如 : 计算 参数 的 顺序 。 

坏 代 码 (bad code); 

术 定 义 的 (undefined) 一 一 在 某 些 不 正确 情况 下 的 做 法 ， 但 标准 并 未 规定 应 该 怎样 做 。 你 
可 以 采取 任何 行动 ， 可 以 什么 也 不 做 ， 也 可 以 发 出 一 条 警告 信息 ， 或 者 可 以 中 下 程序 以 及 证 
CPU 陷入 疤 病 ， 其 至 可 以 入 射 核 导 弹 〈 上 只 要 你 安装 了 能 发 射 核弹 的 硬件 系统 )。 

例如 ， 当 一 个 有 符号 整数 溢出 时 该 求 取 什 么 行动 。 

约束 条 件 (a constraint 一 一 这 是 .一 个 必须 遵守 的 限制 或 查 求 。 旭 果 你 不 遵守 ， 烛 女 你 的 程 
序 的 行为 就 会 变 成 像 上 面 所 说 的 属于 未 定义 的 。 这 就 出 现 了 一 种 很 有 意思 的 情况 ， 分辨 菜 种 
东 同 是 否 是 一 个 约束 条 件 起 很 容易 的 ， 因 为 标准 的 每 个 主题 都 附 有 一 个 “约束 (constraint)” 
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小 节 ， 列 出 了 所 有 的 约束 条 件 。 现 在 又 出 坑 了 -个 更 为 有 趣 的 情况 : 标准 规定 ' 编 译 器 只 有 在 
违反 语法 规则 和 约束 条 件 的 情况 下 才能 产生 错误 信息 ! 这 意味 若 所 有 不 届 十 约束 条 件 的 语义 
规则 你 者 可 以 不 遵循 ， 而 此 由 于 这 种 行为 属于 林 定 义 行 为 ， 编 译 器 可 以 采取 任何 行动 ， 甚 至 
不 必 通 知 你 ! 

例如 : a 1。 所 以 ， 企 非 整数 数据 上 使 用 多 操作 符 肯 定 会 引 

-条 错误 1 

te 所 有 亚 C 语言 标准 头 文 件 中 声明 的 标识 符 均 保留 ， 所 以 不 
能 上 启明 :个 叫 作 malloc0 的 函数 ， 因 为 生 标 准 涉 文件 虫 忆 经 有 一 个 殴 数 以 此 为 名 。 但 由 十 这 
个 规定 个 是 约束 条 件 ,因此 可 以 韦 及 它 , 而 且 编 译 器 甚至 可 以 不 警告 你 ! 关 本 “interpositioning ” 
这 一 小 节 的 更 多 内 容 ， 参 所 第 5 竟 。 





未 定义 的 行为 在 IBM PC 中 引起 CPU 次 交 ! 


未 定义 的 软件 行为 引起 CPU 玫 痰 的 说 法 并 不 像 它 年 听 上 去 那样 这 强 。 

IBM PC 的 显示 器 以 显示 控制 芯片 所 提供 的 水 平 扫描 速率 工作 . 回 扫 变压器 (fyback 
transformer， 一 种 产生 高 电压 的 装置 ， 用 于 加 速 电子 以 点 亮 显示 器 上 的 莞 光 物 质 ) 需要 保持 
一 个 合理 的 频率 。 

然而 在 软件 中 ， 程 序 员 有 可 能 把 视频 芯片 的 扫描 速率 设置 成 零 ， 这 样 就 会 产生 一 个 恒定 
的 电压 输出 到 回归 变压器 的 输入 端 。 这 就 使 它 起 了 电阻 器 的 作用 ， 人 全 扩 六 折 拉 
而 不 是 传送 到 屏幕 。 这 会 在 数秒 之 内 就 把 显示 器 烧 呈 ， 那 就 是 未 定义 的 软件 行为 会 导致 系统 
竣 疾 的 理由 。 
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可 移植 的 代码 (portabls code); 
严格 遵循 标准 的 (strictly-conforming) 一 一 -个 严格 遵循 标准 的 各 序 应 该 
， 内 使 用 凯 确 定 的 特性 。 
， 不 突破 任何 由 编译 六 实 现 的 限制 。 
。 不 产生 任何 依赖 山 编 详 器 定义 的 或 未 确定 的 或 未 定义 的 特性 的 输出 。 


如 果 你 想 创 根 问 底 ， 它 位 于 第 5.1.1,3 段 ， “Diagnostics【 诊 断 } ”。 伯 为 一 个 诸 言 标准 ， 它 不 会 简单 地 说 “在 -一 个 不 正确 的 程 
序 皇 ， 你 必须 为 每 个 错 谋 准 和 一 个 际 志 ”。 作 为 标准 ， 其 用 藤 必 然 联 四 山 六 ， 仿 忻 是 由 靠 志 腊 交 字 临 饭 的 律师 所 摆 写 的 。 它 的 
止 式 用 群 如 下 : “个 洒 和 护 标准 的 实现 应 该 "至 少 为 每 个 才 译 单元 产 汪 条 诊断 信息 ， 此 中 包含 了 所 有 违反 语法 规则 或 约束 的 
订 为 。 在 其 他 情况 下 不 必 疗 千 诊 断 信息 ”。 

"Brian Seearce” 记 总 结 的 有 几 规 律 -一 如 果 你 听 到 “个 程序 员 说 “ 庶 该 shall) ”， 那么 他 一 定 在 引用 标准 里 的 说 法 ， 
“ 杠 食 肢 注 inested footmote) 的 发 明 者 。 
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这 样 规 定 的 二 要 日 的 就 是 最 大 限 大 地 保证 可 移植 性 。 这 样 ， 不 论 你 在 什么 平台 二 过 行 产 
格 遵循 标准 的 程序 都 会 产生 相同 的 得 出 。 事 实 上 ， 人 所 有 遵循 标准 的 程序 小 ， 届 十 这 类 的 
程序 并 不 多 例 则 ， 下 下 这 个 程序 丈 不 是 严格 遵循 林 准 的 : 

tinclude < 上 imite ,bh: 


tinclude <stdio.h> 
int mainiy { tvoid.printf{i"bigeast ing js Sd", LN MAX) 7 return 0;} 


/+ 并 不 严格 遵 御 标准 :其 输出 结果 是 由 编译 器 定义 的 、*/ 

在 本 书 的 剩余 部 分 ， 我 们 道 常 并 不 强求 例子 程序 严格 遵循 标准 。 因 为 如 果 这 样 做 会 使 广 
本 看 | 去 比较 乱 ， 而 兰 不 利于 理解 所 讨论 的 要 点 。 程 序 的 可 移植 性 是 非常 重要 的 ， 押 以 在 你 
的 坝 实 网 码 中 ， 应 该 始终 监 保 证 如 上 必要 的 类 型 转换 、 返 旧 | 值 等 。 

遵 牧 标 准 的 (conforming) 一 一 一 个 遵循 标准 的 程序 可 以 依赖 一 些 其 种 编译 器 特有 的 不 可 
移植 的 特性 。 所 以 ， 一 个 程序 有 可 能 在 一 个 特定 的 编译 器 里 是 遵循 林 准 的 ， 但 齐 另 -个 编 详 
器 内 却 是 不 遵 御 标准 的 。 它 届 以 进行 扩展 , 但 这 些 扩展 不 能 修改 严格 遵循 标准 的 种 序 的 行为 : 
但 和 是， 这 个 规划 并 不 是 -一 个 约束 条 件 ， 所 以 对 十 你 的 程 应 中 不 遵循 标准 之 处 ， 你 不 要 指望 纺 
泽 催 会 给 出 一 条 警告 信息 指出 你 违反 了 规定 ! 

FF 名 所 举 的 几 个 程序 实例 部 是 遵循 标准 的 。 


1.7 编译 限制 


事实 上 ，ANSI C 标准 对 一 个 能 够 成 功 编 详 的 程序 的 最 小 长 度 作 了 限制 ， 这 是 在 标准 第 
5.2.4.1 节 规 定 的 。 绝 大 多 数 语言 都 有 类 似 的 规定 , 如 -个 数据 名 称 (dataname) 最 多 可 以 有 多 少 
个 字符 ， 一 个 多 维 数组 的 维 数 最 多 能 够 达到 多 少 。 但 对 语言 的 某 种 特性 的 最 小 值 作出 规定 ， 
如 果 不 古 独 此 一 家 ， 至 少 也 是 非 比 寻 常 的 。 标 准 委员 会 的 成 员 们 证 论说 这 是 为 了 指导 编译 器 
选择 程序 最 小 能 够 接受 的 长 度 。 

科 一 个 ANSIC 编译 器 必须 能 够 支持 : 

， 在 水 数 定义 中 形 参 数量 的 上 限 至 少 可 以 达到 31 个 。 

。 在 函数 调用 时 实 参 数量 的 上 限 至 人 少 叮 以 达到 31 个 。 

。 在 -条 源 代 公 行 里 至 少林 以 有 509 个 字符 。 

。 件 表 达 式 中 全 少林 以 支持 32 层 嵌 食 的 括号 。 

。 long int 的 最 大 值 不 得 小 于 2 147 483 647 (就 是 说 , long 型 整数 不 得 低 十 32 位 ) 等 等 。 
进而 ， “个 遵循 标准 的 编 详 器 必须 能 够 编 详 并 执行 -个 满足 上 面 这些 限 制 的 程序 。 令 人 惊异 
的 是 ， 上 而 这 些 “ 必 须 ” 的 限制 实际 上 并 不 是 约束 条 件 ， 所 以 当 编 译 器 发 现 违反 上 述 规定 的 
情况 时 并 不 “ 定 产 生 错 误 信 息 。 

编 详 器 限制 通常 是 “个 “ 编 详 器 质量 ”的 话题 。 在 ANSI C 标准 中 也 含 它们 就 是 因 认 如 
果 所 有 的 编译 器 都 设置 一 些 容 量 上 的 限制 ， 就 会 上 加 有 利 十 代 伺 的 移 精 。 当 然 ， 一 个 次 于 优 
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秀 的 编译 器 不 应 该 有 预 炎 的 限制 ， 而 应 该 只 受 一 些 外 部 内 素 的 限制 ， 如 可 用 的 内 存 或 硬盘 从 
间 等 . 这 可 以 通过 使 用 链 志 或 必要 时 动态 扩展 表 的 大 小 (这 个 技 马 将 在 第 10 草 解释 ?来 实现 。 


18 _ ANSIC 标准 的 结构 


如 时 我 们 岔 开 话 题 ， 银 速 浏览 一 下 ANSIC 标准 的 出 处 利 内容 ， 对 污 省 应 该 是 有 帮助 的 。 
ANSIC 标准 分 成 四 个 主要 的 部 分 : 

第 4 节 : 介绍 〈 共 S$ 页 )。 对 术语 进行 介 络 和 定义 。 

第 s 节 : 环境 ( 共 13 页 )。 描述 了 围绕 和 支持 CC 语言 的 系统 ， 包 括 人 在 程 序 启 动 时 发 生 什 
么 ， 程 序 中 止 时 发 生 和 什么 ， 以 及 一 些 信号 利 浮 点 数 运算 ， 继 译 器 的 最 低 限 制 和 字符 集 信息 也 
在 这 一 部 分 介绍 。 

第 6 节 :C 语言 ( 共 78 页 )。 标 准 的 这 部 分 是 基 丁 Dennis Ritchie 数 次 出 版 的 经 典 之 作 *The 
C Reference Manual”， 包 括 The C Programming Language 的 附录 A。 如 果 对 比 标准 和 附录 ， 
了 台 会 发 现 大 多 数 标题 部 是 一 样 的 ， 顺 序 也 相同 .标准 中 的 主题 用 和 醉 生硬 ， 看 上 去 像 表 1-1 那 
样 “ 空 腿 的 子 段落 被 省 略 >。 

表 1-1 ANSIC 标准 段落 形式 一览 








ANSI C 标准 中 段落 的 一 - 般 形式 ANSIC 标准 中 段落 举例 
段落 号 主题 6.4 常量 表达 式 
请 法 语法 
诸 法 网 常量 表达 式 : 
条 件 表 达 人 区， 
描述 措 述 











语言 特性 的 “ 般 描述 常量 表达 式 可 以 在 编译 时 而 不 是 运行 时 计算 ， 因 而 冲 以 
出 现在 任何 常量 可 以 出 现 的 地 方 
约束 条 件 

常 最 表达 式 不 应 该 包含 赋值 、 增 值 、 减 值 、 函 数 主 用 利 
逗号 操作 符 ， 除 眉 它 们 包含 在 sizeof 的 操作 数 内 。 每 个 常量 
表达 式 应 该 计算 成 一 个 常量 ， 该 常量 应 该 在 其 类 型 可 以 表示 
| 的 范围 之 内 
语义 

计算 结果 是 一 个 常量 的 常量 表达 式 为 -- 些 上 涉 文 环境 中 
所 需要 。 如 果 一 个 浮 点 表达 式 在 翻译 环境 中 被 计算 ， 计 算 的 
精度 和 ... 


约束 条 件 
这 里 所 麟 的 任何 规则 如 果 被 破坏 ， 编 
译 内 应 该 给 出 一 条 错误 信息 





语义 
该 特性 的 意思 是 什么 ， 超 什 么 作用 
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ANSI C 标准 中 段落 的 -~- 般 形式 ANSI C 标准 中 段落 举例 
实例 


" 段 展示 语言 特性 的 代 好 





最 初 的 附录 只 有 40 页 ， 但 在 ANSIC 标准 中 ， 是 是 多 了 倍 。 

第 ?7 节 : C 运行 库 (并 81 页 )。 汪 节 提 供 了 一 个 遵循 标准 的 编 详 器 必须 提供 的 库 函 数列 
此 ， 它 们 是 标准 所 规定 的 辅助 和 实用 函数 ， 用 于 提供 基本 的 或 有 用 的 功能 。ANSI C 标准 第 7 
节 所 描述 的 C 运行 库 是 法 于 hsergroup 1984 年 的 标准 ， 去 除了 一 些 UNIX 特有 的 部 分 。 
“usergroup” 是 … 个 于 1984 年 成 立 的 UNIX 国际 用 户 小 给 。1985 年 , 它 虽 名 为 “UniPorum ”， 
它 现在 是 一 个 非 熏 利 性 行业 协会 ， 其 宗旨 是 完善 UNTX 操作 系统 。 

UniForum 从 行为 的 角度 对 UNIX 进行 了 成 功 的 定义 , 这 激励 了 许多 有 创造 性 的 想法 , 包 
括 X/Open 的 可 移植 性 指 时 方针 (第 4 版 ,XPGA4 出 现 于 1992 年 12 月 ) IEEE 的 POSIX 1003、 
System VY interface Definition( 系统 5 接口 定义 ) 以 及 ANSIC 标准 淫 数 库 。 竺 个 人 部 与 ANSJ 
C 工作 小 组 协作 ， 确 保 他 们 所 有 的 标准 草案 柑 生 之 间 保 持 一 繁 。 感 澳 上 沉 ! 

ANSIC 标准 同时 附 厅 一 些 很 有 用 的 附录 : 

附录 F， 一 般 警 告 信息 。 在 许多 常见 的 情况 下 ， 诊 断 信息 并 非 标 准 所 强制 要 求 ， 但 如 果 
有 这 方志 的 信息 ， 和 肯定 对 程序 员 有 帮助 作用 。 

附录 G: 可 移植 性 话题 。 有 一 些 关 于 可 移植 性 的 一 般 性 建议 ， 把 滔 布 标准 各 处 的 所 有 这 
方面 的 建议 集中 在 一 个 地 六 。 它 包括 林 确 定 的 、 未 定义 的 和 出 编 详 器 定义 的 行为 等 方面 的 售 
轧 。 





标准 设立 后 轻易 不 作恶 动 ， 即 使 是 修改 错误 
并 不 能 因为 标准 是 由 国际 标准 组 织 所 撞 写 的 就 认定 它 必然 完整 、 一 致 乃至 正确 。IEEE 


POSIX 1003.1-1998 标准 ( 它 是 一 个 操作 系统 标准 ， 定 义 类 似 UNIX 的 行为 ) 就 存在 一 个 非常 
有 趣 的 自 相 矛盾 的 地 方 : 


“[ 一 个 路 径 名 ]... 最 多 由 PATH_MAX 个 字 节 所 组 成 ， 包 括 最 后 面 的 “0' 字 符 ” 一 一 摘 
自 第 2.3 节 。 

“PATH_MAX 是 一 个 路 径 名 中 最 多 能 出 现 的 字 节 个 数 (并 不 是 字符 串 的 长 度 ， 不 包括 
最 后 面 的 “0” 字符 " 一 一 -摘自 第 2.9.5 节 。 

所 以 ，PATH-MAX 个 字 节 既 和 包括 最 后 面 的 0， 又 不 包括 最 后 面 的 A0' 
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看 来 需要 加 以 解释 ,答案 ( IEEE Std 1003.1-1988ANT,1992 版 ， 解 炙 编 号 : 15， 第 36 页 ) 
认为 标准 出 现 了 不 一 致 ， 不 过 两 个 结果 可 以 认为 都 是 正确 的 【这 念 人 很 感 奇 怪 ， 因 为 一 般 的 
观点 认为 它们 不 可 能 两 个 都 是 正确 的 ) . 

之 所 以 出 现 这 个 问题 是 由 于 在 修改 革 案 时 ,， 所 有 出 现 这 介词 的 地 方 并 未 得 到 全 部 更 新 。 
标准 化 过 程 非常 重视 形式 ， 显 得 僵化 。 如 要 更 新 ， 只 有 投票 小 组 批准 后 才 允 许 对 问题 进行 修 
改 。 

这 样 的 错误 也 曾 出 现在 C 标准 最 早期 的 脚注 里 ， 也 就 是 所 附 的 Rationale 文档 ， 事 实 上 ， 
Rationale 现在 已 不 属于 C 标准 的 一 部 分 ， 当 标准 的 所 有 权 移 交 到 ISO 于 ， 它 就 被 删 掉 了 . 





K&RC 和 ANSIC 之 间 的 区 别 


阅读 本 节 内 容 时 ， 我 侵 定 你 已 经 完全 明白 K&R C, 对 ANSTC 也 已 知道 了 905，ANSTC 
和 K&&RC 的 区 别 分 成 四 大 类 ， 按 其 重要 性 分 列 于 下 : 

1. 第 一 类 区 别 是 指 一 些 新 的 、 非 常 不 同 的 、 并 且 很 重要 的 东西 。 惟 一 属于 这 类 区 别 的 特 
性 是 原型 一 一 把 形 参 的 类 漠 作 为 通 数 声明 的 一 部 分 。 原 型 使 得 编译 器 很 容易 根据 邓 数 的 定义 
检查 函数 的 用 法 。 

2. 第 二 类 区 别 是 一 些 新 的 关键 字 。ANSIC 正式 增加 了 一 些 关键 字 : enum 代表 枚 举 类 型 
(最 初出 现 于 pce 的 后 期 版 本 ) ，const、volatile、signed、void 也 有 各 自 相关 的 语义 。 另 外 ， 
原先 可 能 由 于 芍 息 而 加 入 测 C 中 的 关键 字 entry 则 痉 之 不 用 。 

3. 第 三 类 区 别 被 称 作 “ 安 静 的 改变 ”一 一 原先 的 有 些 语言 特性 仍然 合法 ， 但 它 的 意思 有 
了 一 些 轻微 的 改变 。 这 方面 的 例子 很 多 ， 但 都 不 是 很 重要 ， 几 乎 可 以 被 忽略 。 在 你 偶尔 漫步 
于 它们 之 上 时 ， 可 能 由 于 不 注意 而 被 其 中 一 个 缮 了 个 起 超 。 例 如 ， 现 在 的 预 处 理 规则 定义 得 
更 加 严格 ， 有 一 条 新 规则 ， 就 是 相 邻 的 字符 串 字 面值 会 被 自动 连接 在 一 起 。 

4. 最 后 一 类 区 别 就 是 除 上 面 3 类 之 外 的 所 有 区 别 ， 包 括 那些 在 语言 的 标准 化 过 程 中 长 其 
争论 的 东西 ， 这 些 区 别 在 现实 中 几乎 不 可 能 碰 到 ， 如 符号 粘贴 (token-pasting) 和 三 字母 词 
(trigraph) ( 三 字母 词 就 是 月 3 个 字符 表示 一 个 单独 的 字符 ， 如 果 该 字符 不 存在 于 某 种 计算 机 
的 字符 集中 , 就 可 以 用 这 3 个 字符 来 表示 ,比如 两 字母 词 (digraph)\t 表示 “tab”, 而 三 字母 词 99< 
则 表示 “开放 的 花 括 号 ” ) 。 | 


ANSIC 中 最 重要 的 新 特性 就 是 “原型 ”这 种 特性 取 自 C++。 原 型 是 函数 声 基 的 扩展 ， 
这 样 不 仪 函数 名 和 返回 类 型 己 知 ， 所 有 的 形 参 类 型 也 是 已 知 的 。 这 就 允许 编译 器 在 参数 的 使 
用 和 声明 之 间 检 在 一 致 性 。 把 “原型 ” 称 作 是 “ 带 有 所 有 参数 的 函数 名 ” 赴 不 够 充分 的 ， 它 
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应 该 被 称 作 “函数 签名 (fnnction signiture)”， 战 者 像 Ada 那样 称 作 “ 疝 数 说 明 (function 


specification) ”。 





原型 的 形成 


原型 的 目的 是 当 我 们 对 函数 作 前 向 声明 (forward declaration) 时 ， 在 形 参 类 型 中 增加 一 些 
信息 (而 不 仅仅 是 函数 名 和 返回 类 型 ) 。 这样， 编译 器 就 能 够 在 编译 时 对 函数 调用 中 的 实 大 
和 元 数 声 明 中 的 形 参 之 间 壕 行 一 致 性 检查 。 在 K&R C 中 ， 这 种 检查 被 失 迟 到 链接 时 ， 或 者 
干脆 不 作 检 查 。 使 用 原型 以 后 ， 原 先 的 : 

char * strcepy!{); 
现在 在 头 文件 中 的 形式 如 下 : 

char * Strcpy (char *dst, const char *src); 

可 以 省 略 参 数 名 称 ， 只 保留 套数 类 型 : 

Char * strcpy lchar *, const char *); 

但 最 好 不 要 省 略 形 参 名 。 尽 管 编译 器 并 不 理 皮 形 参 的 名 称 ， 但 它们 经 常 能 向 程序 员 们 传 
递 一 些 有 用 的 信息 。 类 似 地 ， 通 数 的 定义 也 从 : 

char * strcpy (dst, src) 


char *dstl, *Src; 

(i 
变 成 了 : 

char * strcpy (char *dst， const char *src) /* 注意 没有 分 号 */ 

人 六 

函数 头 不 再 以 一 个 分 所 结尾 ， 而 是 在 后 面 紧 接 一 个 组 成 函数 体 的 复合 语句 。 

每 次 编写 新 函数 时 都 应 该 使 用 原型 ， 并 确保 它 在 每 次 调用 时 都 可 见 。 不 要 回 到 K&R C 
老式 的 泡 数 声明 方法 ， 除 非 需要 使 用 缺 省 的 类 型 升级 ( 这 个 话题 在 第 8 章 详细 讨论 ) . 


把 同一 种 东西 用 儿 个 不 同 的 术语 来 称呼 ， 确 实 有 点 神秘 。 就 好 像 药 品 至 少 有 3 种 名 称 一 
样 ， 化 学 名 ， 商 曲名 和 常用 名 。 
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1.9 阅读 ANSIC 标准 ， 寻 找 乐趣 和 神 巷 


有 了 时候 必须 非常 专注 地 阅读 ANSI C 标准 才能 找到 某 个 问题 的 答案 。 一 位 销售 | 程 师 把 
上 而 这 段 代 码 作为 测试 例 发 给 Sun 的 编 详 器 小 组 。 


foolconst char **p) { )} 


下 
2 

3 min{int iargc， 

A411 

如 果 统 译 这 段 代 人 包 ， 编 译 器 会 发 出 一 条 警告 信息 : 

line 5; warning: argment is incomcatible witn DrotoLype 

(第 5 行 ， 警告 ， 参数 与 原型 不 匹配 )。 

提交 代码 的 芽 程 师 想 知 道 为 什么 会 产生 这 条 警告 信息 ， 也 想 知 道 ANSI C 标准 的 哪 一 部 
分 讲述 了 这 方面 的 内 容 。 他 认为 ， 实 参 char* s 与 形 参 const char *p 应 巾 是 柑 容 的 ， 标 准 库 中 
所 有 的 字符 串 处 理 阴 数 都 是 这 样 的 。 邦 么 ， 为 什么 实 参 char **argv 与 形 参 const char **p 实 
际 上 不 能 相 容 呢 ? 

答案 是 肯定 的 ， 它 们 并 不 相 容 。 要 回答 这 个 问题 颇 费 心机 ， 如 果 人 研究 一 下 获得 这 个 答案 
的 整个 过 程 ， 会 比 仅 仅 知道 结论 更 有 意义 。 对 这 个 问题 的 分 析 是 Ih Sun 的 其 中 一 位 “语言 律 
师 ” 进行 的 ， 其 过 程 如 下 : 

在 ANSIC 标准 第 6.3.2.2 节 中 讲述 约束 条 件 的 小 节 中 有 这 么 一 句 话 : 

每 个 实 参 都 应 该 具有 自己 的 类 型 ,这样 它 的 值 就 可 以 赋值 给 与 它 所 对 应 的 形 参 类 型 的 对 
划 (该 对 象 的 类 型 不 能 含有 限定 符 ) . 

这 就 十 说 参数 传递 过 程 类 似 于 赋值 。 

所 以 ， 除 非 一 个 const char *# 类 型 的 对 象 可 以 赋值 给 一 个 类 型 为 char ** 的 值 ， 和 否则 肯定 
会 产生 一 条 诊断 信息 。 要 想 知 道 这 个 赋值 是 否 合法 ， 就 请 回顾 标准 中 有 关 简 单 赋值 的 部 分 ， 
它 位 于 第 6.3.16.1 节 ， 描 述 了 下 列 约 束 条 件 : 

要 使 上 述 的 赋值 形式 合法 ， 必 须 满足 下 列 条 件 之 一 : 

两 个 操作 数 都 是 指向 有 限定 符 或 无 限定 罕 的 相 容 类 型 的 指针 ， 左 边 指针 所 指向 的 类 型 必 
须 具 有 右边 指针 所 指向 类 型 的 全 部 限定 符 。 


止 是 这 个 条 件 ， 使 得 函数 调用 中 实 参 char* 能 够 与 形 参 const char+ 匹 配 〔〈 在 C 标准 库 中 ， 


1 The New Hacker's Dictionary 把 证 言 律师 定义 为 “能 从 200 多 页 的 手册 中 志 取 5 句 话 ， 拼 起 来 放 到 你 面前 ， 你 只 要 : -看 就 能 呈 
白 自 己 问 题 的 答案 的 人 ”， 嘿 ! 在 这 个 例子 的 情况 下 正 是 如 此 。 
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C 专家 编程 
所 有 的 字符 串 处 理 国 数 就 是 这 样 的 )。 它 之 所 以 合法 ， 是 因为 在 下 面 的 代 妈 由: 

char *cp; 

const char *ccp; 

cep = Cp; 

。 左 操作 数 是 一 个 指向 有 const 限定 符 的 char 的 指针 ， 

， 右 操 作 数 是 一 个 指 铭 没有 限定 符 的 char 的 指针 , 

char 类 型 与 char 类 型 是 相 容 的 ， 左 操作 数 所 指 癌 的 类 型 具有 右 把 作 数 所 指向 类 型 的 

服 定 符 《〈 无 )， 调 加 上 自身 的 限定 符 (constj。 

注意 ， 反 过 来 就 不 能 进行 赋值 。 如 果 不 信 ， 试 试 下 而 的 代 公 ; 

cp = cep; /* 里 果 产生 编译 警告 */ 

标准 筑 6.3.16.1 节 有 没有 有 说 char ** 实 参与 const char * 形 参 是 相 容 的 ? 没有- 

标准 第 6.1.2.5 节 中 讲 运 实例 的 部 分 声称 : 

const float * 类 型 并 不 起 一 个 有 限定 符 的 类 型 一 一 它 的 类 型 是 “指向 一 个 具有 const 限定 
符 的 float 类 型 的 指针 ”， 也 就 是 说 const 限定 符 是 修饰 指针 所 指向 的 类 型 ， 而 不 是 指针 本 身 ， 


类 似 地 ，const char ** 世 是 一 个 没有 限定 符 的 指针 类 型 。 它 的 类 型 是 “指向 有 const 限定 
符 的 char 类 型 的 指针 的 指 行 ”。 

由 于 char ** 利 const char ** 都 是 没有 限定 符 的 指针 类 型 , 但 它们 所 指向 的 类 型 不 --- 样 {前 
者 指 问 char *， 后 者 指 问 const char *)， 因 此 它们 是 不 相 容 的 。 因 此 ， 类 型 为 char** 的 实 参 与 
类 型 为 const char** 的 形 参 是 椒 相 容 的 ， 迁 反 了 标准 第 6.3.2.2 节 所 规定 的 约束 条 件 ， 编 译 器 
必然 会 产生 :条 诊断 信息 。 

用 这 种 方式 理解 这 个 要 点 有 - - 定 困难 ， 可 以 用 下 面 这 个 方法 进行 理解 ， 

， 左 襄 作 数 的 类 型 是 FOO2， 它 是 一 个 指向 FOO 的 指针 ， 而 FOO 是 一 个 没有 限定 符 的 
指针 ， 它 指向 一 个 带 有 const 限定 符 的 char 类 型 ， 而 且 …… 

。 布 操 作 数 的 类 型 是 BAZ2， 它 是 -个 指向 BAZ 的 指针 ， 而 BAZ 是 -- 个 没有 限定 符 的 
指针 ， 它 指 问 一 个 没有 限定 符 的 字符 类 型 。 

FOO 和 BAZ 所 指向 的 类 模 是 相 容 的 ， 而 且 它 们 本 身 部 没有 限定 符 ， 所 以 符合 标准 的 
约束 条 件 ， 两 者 之 间 进 行 赋值 是 合法 的 。 但 FOO2 和 BAZ2 之 间 的 关系 又 有 不 同 ， 川 于 相 
容 性 是 不 能 传递 的 ，FOO 和 BAZ 所 指向 的 类 型 相 容 并 不 表示 FOO2 和 BAZ2 所 指向 的 类 
型 也 相 容 , 所 以 虽然 FOO2 和 BAZ2 都 没有 限定 符 , 但 它们 之 间 不 能 进行 赋值 ,。 也 就 是 说 ， 
它们 都 是 不 带 限定 符 的 指 参 ， 但 它们 所 指向 的 对 象 是 不 柑 容 的 , 所 以 它们 之 问 不 能 进行 赋 
值 ， 也 号 不 能 分 别 作为 函 交 的 彤 参 和 实 参 。 但 是 ， 这 个 约束 条 御 很 令 估 恼火， 也 很 容易 让 
用 户 混 淆 。 所 以 ， 这 种 赋值 方法 上 且 前 在 基于 Cfront 的 C++ 翻 详 器 中 是 合法 的 《虽然 这 在 
将 来 可 能 会 改变 )。 
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关键 字 const 并 不 能 把 变量 变 成 常量 ! 在 一 个 符号 前 加 上 const 限定 符 只 是 表示 这 个 符号 
不 能 被 赋值 . 也 就 是 它 的 值 对 于 这 个 符号 来 说 是 只 读 的 , 但 它 并 不 能 防止 通过 程序 的 内 部 ( 其 
至 是 外 部 ) 的 方法 来 修改 这 个 值 ,|const 最 有 用 之 处 就 是 用 它 来 限定 未 数 的 形 参 | 这样 该 函数 
将 不 会 修改 实 参 指 针 所 指 的 数据 ， 但 其 他 的 函数 却 可 能 会 修改 它 . 这 也 许 就 是 C 和 C++ 中 
const 最 一 般 的 用 法 ， 

const 可 以 用 在 数据 上 ， 如 ; 


const int limit = i0; 
这 和 其 他 语言 差不多 ， 但 当 你 在 等 式 两 边 加 上 指针 ， 就 有 一 定 难 度 了 : 
const int w 1ImLp = &limi-;; 
int i = 27; 
limitp = &i; 
这 段 代码 表示 jimitp 是 一 个 指向 常量 整 型 的 指针 。 这 个 指针 不 能 用 于 修改 这 个 整 型 数 ， 
但 是 在 任何 时 候 ， 这 个 指针 本 壬 的 值 却 可 以 改变 。 这 样 ， 它 就 指向 了 不 同 的 地 址 ， 对 它 进行 
解除 引用 (dereference) 澡 外 时 会 得 到 一 个 不 同 的 值 ! 
const 和 * 的 组 合 通常 信用 于 在 数组 形式 的 参数 中 模拟 传 值 调用 。 它 声称 “我 给 你 一 个 指 
向 它 的 指针 ， 但 你 不 能 修改 它 。” 这 个 约定 类 似 于 极为 常见 的 void * 的 用 法 ， 尽 管 在 理论 上 
它 可 以 用 于 任何 情形 ， 但 通常 被 限制 于 把 指针 从 一 种 类 型 转 撞 为 另 一 种 类 型 。 
类 羽 地 ， 体 可 以 取 一 个 const 灾 量 的 地 址 ， 并 且 可 以 .,.( 唔 ， 我 最 好 不 要 往 大 家 的 脑 
袋 里 灌输 这 种 思想 ) 。 正 如 Ken Thompson 所 指出 的 那样 ，“const 关键 字 可 能 引发 一 些 
军 见 的 错误 ， 只 会 混 清 别 数 库 的 接口 。” 回 首 往事 ，const 关键 字 原 先 如 果 命 名 为 readonly 
就 好 多 了 ， 


确实 ， 整 个 标准 好 像 是 由 一 位 冶 脚 的 翻译 把 它 从 芒 尔 都 语 转译 成 丹麦 滞 ， 再 转 详 成 英 洁 
而 来 。 标 准 委 员 会 似乎 自我 感觉 恨 好 ， 所 以 虽然 人 们 希望 语音 的 规则 更 简单 一 些 、 更 清楚 :一 
此 ， 但 他 们 觉得 这 样 做 会 破坏 他 们 的 良好 感觉 ， 所 以 扩 不 采纳 。 

我 感觉 ， 将 米 太 会 有 许多 人 产生 类 似 的 疑问 ， 而 且 并 不 赴 他们 中 的 每 -个 人 都 会 仔细 撕 
摩 前 面 详 述 的 推理 过 程 。 所 以 ， 我 们 修改 了 Sun 的 ANSI C 编 详 疾 ， 当 它 发 现 不 由 容 的 情况 
时 ,会 打印 出 更 多 的 警告 信息 。 原 先 那 个 例子 将 会 产生 的 完整 信息 如 下 : 

Line 6: warning : argument #1 is imcompat.icle witlh prototype: 

prototype: pointer to pointer to const char: ‘barf.c", line 1 


argument: pointie” to pointer to char 
原型 : 指向 const char 的 指针 的 指针 。 "barf.c"， 第 1 行 
实 参 ;指向 char 的 指针 的 指针 。】 
即使 程序 员 不 明白 为 什么 会 这 样 ， 他 至 少 应 该 明白 什么 是 不 相 容 。 


1.10 “安静 的 改变 ”究竟 有 多 少 安静 


标准 所 作 的 修改 并 非 都 如 原型 那样 引 人 注 日 。ANSI C 作 了 其 他 一 些 修 改 ， 目 的 是 使 C 
语言 更 加 可 靠 。 例如 ,“ 寻 常 算术 转换 (usual arithmetic conversiony” 存 吊 式 的 K&R C 和 ANSI 
和 中 的 意思 就 有 所 不 同 。Kemighan 和 Ritchie 当初 茂 这样 写 的 : 


第 6.6 节 : 算术 转换 

许多 运算 符 都 会 引发 转换 , 以 类 似 的 方式 产生 结果 类 型 。 这 个 模式 称 为 “寻常 算术 转换 ”， 

首先 ,任何 类 型 为 cha- 或 short 的 操作 数 被 转换 为 int, 任何 类 型 为 float 的 操作 数 被 转换 
为 double. 其 次 ， 如 果 其 中 一 个 操作 数 的 类 型 是 douhle， 那么 另 一 个 操作 数 被 转 搁 成 double， 
计算 结果 的 类 型 也 是 doubl:， 再 次 ， 如 果 其 中 一 个 操作 数 的 类 型 是 long， 那 么 另 一 个 操作 数 
被 转 接 成 Ipng， 计 算 结 果 的 类 型 也 是 long。 或 符 ， 如 果 其 中 一 个 操作 数 的 类 型 是 unsigned， 
那么 另 一 个 操作 数 被 转换 成 unsigned， 计 算 结果 的 类 型 也 是 unsigned。 如 果 不 符 合 上 面 几 种 
情况 ， 那 么 两 个 操作 数 的 闫 型 都 作为 int， 计 算 结果 的 类 型 也 是 int， 

ANSIC 手册 重新 编写 了 有 关内 容 ， 填 补 了 其 中 的 漏洞 : 

第 6.2.1.1 节 字符 和 整 型 ( 整 型 升级 ) 

char, short int 或 者 int 型 位 段 (bit-ficld), 包括 它们 的 有 符号 或 无 符号 变型 , 以 及 枚 举 类 型 ， 
可 以 使 用 在 需要 int 或 unsifrmed int 的 表达 式 中 。 如 果 int 可 以 完整 表示 源 类 型 的 所 有 值 !， 那 
么 该 源 类 型 的 值 就 转换 为 ht， 否则 转 摘 为 unsigned int。 这 称 为 整 型 升级 ， 

第 6.2.1.5 节 寻常 算术 转 接 

许多 操作 数 类 型 为 兽 术 类 型 的 双 目 运算 符 会 引发 转换 ， 并 以 类 似 的 方式 产生 结果 类 型 ， 
它 的 目的 是 产生 一 个 普通 类 型 ， 同 时 也 是 运算 结果 的 类 型 。 这 个 模式 称 为 “寻常 算术 转换 ”， 

首先 ， 如 果 其 中 一 个 操作 数 的 类 型 是 long double， 那 么 另 一 个 操作 数 也 被 转换 为 long 
double。 其 次 ， 如 果 其 中 一 个 操作 数 的 类 型 是 double， 那 么 另 一 个 操作 数 也 被 转换 为 double. 
再 次 ， 如 果 其 中 一 个 操作 数 的 类 型 是 float， 那 么 另 一 个 操作 数 也 被 转换 为 oat。 否 则 ， 两 个 
操作 数 进行 整 型 升级 (第 6.2.1.1 节 描 述 整 型 升级 )， 执 行 下 面 的 规则 : 

如 果 其 中 一 个 操作 数 的 类 型 是 unsigned long int， 那 么 另 一 个 操作 数 也 被 转换 为 unsigned 
long int。 其 次 , 如果 其 中 一 个 操作 数 的 类 型 是 long int, 而 另 一 个 操作 数 的 类 型 是 unsigned int, 


】 即 inl 是 和 2 位 ,一 一 译 阁 注 
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如 果 long int 能 够 完整 表示 unsigned int 的 所 有 值 ', 那么 unsigned int 类 型 操作 数 被 转换 为 Iong 
int， 如 果 long int 不 能 完整 表示 unsigned int 的 所 有 值 ， 那么 两 个 操作 数 都 被 转换 为 unsigned 
long jint。 再 次 ， 如 果 其 中 -- 个 操作 数 的 类 型 是 long int， 那 么 另 一 个 操作 数 被 转换 为 long int， 
再 再 次 , 如果 其 中 一 个 操作 数 的 类 型 是 unsigned int, 那么 另 一 个 操作 数 被 转换 为 unsigned int， 
如 果 所 上 以 上 情况 都 不 属于 ， 那 么 两 个 操作 数 都 为 int， 

浮 点 操作 数 和 浮 点 表达 式 的 值 可 以 用 比 类 型 本 身 所 要 求 的 更 大 的 精度 和 更 广 的 范围 来 
表示 ， 而 它 的 类 型 并 不 因 比 改变 。 

采用 道 俗语 言 〈 当 然 作 有 漏洞 ， 而 且 不 够 精确 )，ANSIC 林 准 所 表示 的 意 币 大 致 如 下， 

当 执 行 算 术 运 算 时 ， 操 作 数 的 类 型 如 果 不 同 ， 就 会 发 生 转 撞 。 数据 类 型 一 般 朝 着 浮 点 精 
度 更 高 、 长 度 更 长 的 方向 续 换 ， 整 型 数 如 果 转 澳 为 signed 不 会 丢失 信息 ， 就 转 摘 为 signed， 
否则 转换 为 unsigned。 


K&R C 所 采用 无 签 号 保 窗 (unsigned preserving) 原 则 ， 就 是 当 一 个 无 符号 类 型 与 int 或 更 
小 的 整 型 混合 使 用 时 ， 结 果 类 型 是 无 符号 类 型 。 这 是 个 简单 的 规则 ， 与 硬件 无 关 ， 但 是 ， 正 
如 上面 的 例子 所 展示 的 那样 ， 它 有 时 会 使 一 个 负数 针 失 符号 位 。 

ANSI C 标准 则 采用 值 保 留 (value preserving) 原 则 ， 就 是 当 把 儿 个 整 型 操作 数 像 下 面 这 样 
混合 使 用 时 ， 结 果 类 型 有 可 能 臣 有 符 怀 数 ， 也 可能 是 无 符号 数 ， 取 决 于 操作 数 的 类 型 的 相对 
人 小 。 ， 

下 向 的 程序 段 分 别 车 ANSIC 和 K&RC 编 诺 器 中 运行 时 ， 将 打印 出 不 同 的 信息 : 

madinmr if 

if(-1 < (unsigned ciaril 
Printf{f"-l is iess than (unsigned char)1: ANS! semantics ") ; 
el5e 


RBrinti("-l NOT less than (unsigned char;l: K&R semantics"); 
】 


程序 中 的 表达 式 在 两 种 编 详 器 下 编 详 的 结果 不 同 。 一 ! 的 位 模式 是 ， 样 的 ， 但 “个 编译 器 
(ANSIC) 将 它 解释 为 负数 ， 另 -个 编译 器 (K&R C) 却 将 它 解释 为 无 符 叶 数 , 也 就 是 变 成 了 正 数 。 











一 个 微妙 的 Bug 
虽然 规则 作 了 修改 ,但 微妙 的 Bug 依然 存在 。 在 下 面 这 个 例子 里 ,变量 d 比 程序 所 需 的 


， 即 long 是 32 位 而 int 是 16 位。… -译音 注 
” 则 1ong 和 int 均 为 和 2 位 -一 详 首 注 
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下 标 值 小 1， 这 上 段 代码 的 目的 就 是 处 理 这 种 情况 ,但 让 表达 式 的 值 却 不 是 真 。 为 什么 ? 是 不 
是 有 Bug: 


int array[] = { 23, 34, 12, 17, 204, 99, 16 1}; 
#idefine TOTAL_ELEMENTIS (sizeof (array}) /si7eoft larray [2|})) 


main: )} 

{ 
int d = -1, x; 
HE ow 


ifid <= TOTAL_E,JEMENTS - 2) 
xX = drray [c+l;; 
py 
} 
TOTAL_ELEMENTS 所 定义 的 值 是 unsigned int 类 型 【因为 sizeofO) 的 返回 类 型 是 无 符号 
数 ) .证 语 自 在 Signed int 和 unsigned int 之 间 测 试 相等 性 , 所 以 d 被 升级 为 unsigned int 类 型 ， 
-1 转换 成 unsigned int 的 结 时 将 是 一 个 非常 巨大 的 正 整数 ， 致 使 表达 式 的 值 为 假 。 这 个 bug 
在 ANSIC 中 存在 ， 而 如 果 K&R C 的 某 种 编译 器 的 sizeof() 的 返回 值 是 无 符号 数 ， 那 么 这 个 
bug 也 存在 。 要 修正 这 个 吕 题 ， 只 要 对 TOTAL ELEMENTS 进行 强制 类 型 转换 即 可 : 


if{d <= (int} TOTAL_.ELEMENTS — 2) 






对 无 符号 类 型 的 建议 


尽量 不 要 在 你 的 代码 中 使 用 无 符号 类 型 ， 以 免 增 加 不 必要 的 复杂 性 .| 尤其 是 ， 不 要 仅仅 
因为 无 符号 数 不 存在 负 值 "如 年 龄 、 国 债 ) 而 用 它 来 表示 数量 ， 

尽量 使 用 像 int 那样 的 有 符号 类 型 ， 这 样 在 涉及 升级 混合 类 型 的 复杂 细节 时 ， 不 必 担 心 
边界 情况 (如 - 1 被 翻译 为 非常 大 的 正 数 ) 。 

只 有 在 使 用 位 段 和 二 进 制 掩 码 时 ， 才 可 以 用 无 符号 数 。 应 该 在 表达 式 中 侵 用 强制 类 型 转 
接 ， 使 操作 数 均 为 有 符号 娄 或 者 无 符号 数 ， 这 样 就 不 必 由 编 译 器 来 选择 结果 的 类 型 ， 


这 听 起 来 是 不 是 有 点 诡异 ， 赴 不 是 令 人 吃惊 ?确实 如 此 ! 用 前 面 -页 所 说 的 规则 完成 上 
身 这 个 例子 。 
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第 1 章 C: 穿越 时 空 的 迷 鼻 


最 后 ， 为 了 不 让 The Flements of Programming Style 未来 的 版 本 把 这 段 代 公 作为 不 民风 格 
的 实例 ， 我 最 好 解释 一 下 共 中 的 一 些 代码 。 我 使 用 了 下 血 这 条 庄 句 : 

tdefine TOTAL_ELEMSNTS3 (sizecf larray) / sizeoi (array {D0]1) 

而 不 是 ; 

fdaefine TOTRL _ELEMSNIS (SIzecfE 1 arrawy) / slzeof {int}'’ 
因为 前 者 可 以 在 不 修改 #define 语句 的 情况 下 改变 数组 的 基本 类 型 〈《 比 如， 把 int 变 成 char)。 

Sun 公司 的 ANSI C 编译 器 小 组 认为 从 “万 类 型 保留 ” 转 到 “ 值 保留 ”对 于 C 语 志 的 说 
义 而 二 完全 没有 必要 ， 只 会 让 偶尔 遇 到 这 方面 问题 的 人 感到 吃惊 和 肖 形 。 因 此 ， 件 “上 侠 旦 不 
让 人 误会 ”的 原则 下 ，Sun 编 详 器 认可 并 纺 详 ANSIC 的 特性 ， 除 非 该 特性 在 K&R C 里 男 有 
解释 。 如 果 页 人 到 后 而 这 种 情况 ， 编 译 融 在 扎 省 情况 下 使 用 K&R C 的 标准 ， 并 给 出 条 警 伍 
信息 . 如 采 碰 到 上 面 这 个 例子 , 程序 员 应 该 使 用 强制 类 型 转换 告诉 编译 器 最 终 所 希望 的 类 型 ， 
在 Sun 公司 运行 Solaris 2.x 的 工作 站 上 只 要 打开 编 详 器 的 -Xc 于 关 ， 就 可 以 使 编译 器 严格 道 
循 ANSIC 标准 的 语义 。 

在 K&RC 的 许多 特性 中 ,有 许多 在 ANSIC 中 进行 了 更 新 , 包括 许多 所 请“ 安静 的 转变 ”。 
在 这 种 情况 下 ， 代 码 在 上 疯 种 网 译 嚣 里 部 能 通过 编 兰 ， 介 其 体 含义 稍 有 差别 。 六 程序 员 发 现 这 
种 情况 时 ,他 们 的 扩 应 可 想 调 知 。 因 此 , 这 种 转变 事实 上 应 该 称 作 “讨厌 的 转变 ” 总 的 来 说 ， 
ANSI 委员 会 试图 进行 尽 可 能 少 的 改动 ， 与 原先 存 任 的 但 依 实 需 上 监 改进 的 特性 保持 -一 致 . 

对 于 ANSIC 族 系 背 时 知识 的 讨论 已 经 岗 多 了 。 央 此 ， 在 下 侧 的 “轻松 一 下 ”一 节 过 后 ， 
让 我 们 对 回 第 2 章 ， 进 入 从 书 的 中 心 内 容 。 


1.11 轻松 一 下 一 一 由 编译 器 定义 的 Pragmas 效果 


自由 软件 基金 会 (Free Software Foundation) 荐 一 个 独特 的 组 织 , 它 由 MIT 顶 级 黑 窜 Richard 
Stallman 所 创立 。 顺 便 提 -- 下 ， 我 们 所 说 的 “ 交 容 ”， 它 的 原先 意思 是 “天 才 程 序 员 ”后 来 
这 个 称呼 被 媒体 所 贬损 ， 到 使 它 在 局 外 人 眼中 成 了 “ 那 恶 的 天 才 ” 的 代名词 。 和 形容 词 “bad” 
一 样 ,，“ 黑 客 ” 现 在 也 有 其 个 由 反 的 意 筷 ， 必 须 道 过 上 下文 才能 明白 它 的 依 切 意思 。 

Stallman 成 立身 员 软 件 基金 会 的 初衷 龙 : 软件 应 该 足 免 费 的 ， 所 有 人 都 可 以 自 出 使 用 。 
FSF 的 宗 旬 是 “消除 在 计算 机 程序 搭 贝 、 恒 发 布 、 埋 解 和 修改 方面 的 限制 ”， 它 雄心 勃勃 地 想 
建立 个 UNIX 的 自 山 软件 实现 方案 ， 称 为 GNU〈 它 代表 “GNU's Not UNIX”， 半 ， 确 实 如 
此 )， 

许多 计算 机 科学 研究 和 拓 和 其 他 人 赞同 GNU 的 哲学 ， 他 们 设计 软件 产品 ， 由 FSF 进行 打 
包 并 免费 发 布 。 道 过 这 些 甘 心 奉献 的 有 天 赋 的 程序 员 们 的 辛勤 劳动 ， 产 生 了 一 些 优秀 的 软件 





! The Flements of Programming Style, Kemighan【〔 对 ， 就 足 那个 Kemighan》 和 和 Plauger， 纽 约 ，McGraw Hill.1978。 这 是 一 本 文字 
流畅 、 风 节 自 实 的 忧 秀 作品 一 一 卜 常 值得 购买 ， 你 能 从 中 获 益 展 凶 。 
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作品 。FSF 最 好 的 作品 之 -就 是 GNU C 编 详 则 系列，gcc 是 个 健壮 的 、 在 代码 优化 方 血 其 
右 创 造 性 的 编译 器 ， 可 以 在 很 多 硬件 平台 使 用 ， 有 时 其 伴 比 编 详 器 厂 尚 的 产品 更 为 优秀 ， gcc 
开 不 适合 所 厂 的 项 目 ， 它 在 维护 性 和 林 米 版 本 连续 性 方面 伟 存 在 - 些 问 题 。 御 现实 的 开发 中 ， 
除了 编译 合 之 外 , 还 需要 很 多 工具 。 峰 有 很 长 -让 时 间 , GNU 的 调试 点 雹 法 在 鞭 享 库 山 工作 ， 
而 且 在 开发 时 ，GNU C 个 尔 会 让 人 感到 眼花 综 乱 。 

信人 币 订 ANSJ C 标准 时 ， 引 入 了 pragma 指示 符 ， 这 个 指示 符 玉 源 于 Ada。#pragma 几 十 
器 编 泽 器 提示 - 些 信 息 ， 诸 如 希望 把 某 个 特定 郧 数 扩 展 为 内 联 明 数 ， 忌 音 取 消 边 界 的 检查 . 
由 寺 它 并 非 C 语言 所 固有 ，pragma 章 到 了 一 个 gce 编译 器 设计 者 的 积极 抵制 ， 他 把 这 个 “出 
编 详 器 定义 的 ”的 效果 做 得 很 搞笑 一 一 在 gcc 1.34 版 ， 如 果 使 用 了 pragma， 将 会 异化 编译 器 
停止 编 详 ， 而 是 运行 个 计算 机 游戏 ! 存 gcc 干 册 中 有 如 下 说 明 ，; 

在 ANSI C 标准 中 ，“#pragma” 指 令 会 产生 一 个 由 编译 器 定义 的 任意 效果 ,在 GNU C 
预 处 理 器 中 ， 一 旦 遇见 “#ipragma” 指 令 ， 它 首先 试图 运行 “rogue” 游 戏 ， 如 果 失 败 ， 尝试 
运行 “hack” 游 戏 ; 如 果 还 是 失败 ， 它 会 尝试 运行 GNU Emacs， 显示 汉 诺 塔 (Tower of Hanoi)。 
如 果 仍 然 失败 ， 它 就 报告 -- 个 致命 错误 。 总 之 ， 预 处 理 过 程 不 会 继续 下 去 ， 

GNUC 篇 谍 识 1.34 族 天 外 





GNUC 编译 器 中 关于 预 处 理 右 的 邦 部 分 源 代 码 如 下 : 


下 下 
* #pragma 指示 符 的 行 洒 是 由 编译 器 定义 的 ， 
* 在 CNL 《编译 器 中 ， 它 的 定义 如 下 ! 
人 
do_pragma()} 
{ 
close0); 
if topent"/Gevitiy", O_RDONLY, 56668) !1= 0) 
goto nope; 
closell});: 
if{openl"/devittiy", O_ WRONLY, 0666) 1= 1) 
goto nope; 
cxel ("usr/gqames/hack'", "#pragma", 0); 
exel{"/usr/games/rogue", "#pragma", 0}); 
exel ("usr/inew/iemacs", "-f", "hanci*, "9°", "*-xXxill'", 0}; 
exel{"/usr/local /emacs", "-f", "hanoir, "9", *-kii]", 0); 
NoOpe: 人 
falall'"you are in a maze of twisty compiler features, ali different'"}; 
} 


特别 好 笑 的 荐 ， 用 户 手册 中 的 描述 是 错误 的 ， 它 把 “hack” 和 “rogue” 的 次 序 搞 反 了 。 
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这 不 是 Bug ， 而 是 语言 特性 








Bug 是 迄今 为 止 地 球 上 最 庞大 最 成 功 的 实体 类 型 ， 有 近 百 万 种 已 知 的 品种 。 在 这 个 方面 ， 
它 比 其 他 任何 已 知 的 生物 种 类 的 总 和 还 要 多 ， 而 且 至 少 多 出 4 倍 。 
一 一 荔 情 Siope 党 冯 # Encyclopedia of Animal Life 


2.1 这 关 语 言 特 性 何事 ， 在 Fortran 里 这 就 是 Bug 呀 


这 确实 与 编程 诸 言 的 细节 有 关 。 语 言 的 细节 决定 了 一 种 语言 到 底 是 可 靠 的 还 是 容易 滋生 
铬 ; 1961 咎 受 大 ， 一 名 NASA《〈 美 国航 空 航天 局 ) 的 程序 员 戏 同性 地 向 世人 展示 了 这 一 
Alo 他 测试 一 个 用 于 计算 环绕 地 球 轨道 的 Fortran 子 程 ey 
Mercury 飞行 ， 但 它 的 计算 结果 总 是 达 不 到 预期 的 精度 ， 无 法 满 是 更 外 层 的 太空 飞行 和 痘 月 
计划 。 计算 结果 非常 接近 ， 但 与 预期 的 精度 相 比 还 是 有 一 0 丙 。 

经 过 漫长 的 对 算法 、 激 据 和 预期 结果 的 检查 之 后 ， 这 名 工程 师 最 终 注意 到 了 下 面 这 行 代 
码 ; 


Do 10 1 = 1.10 


” 这 个 故 责 被 广泛 误 传 ， 在 许多 称 寿 设计 酒 言 的 教材 中 有 乔 种 不 同 的 不 正确 版 本 。 吉 实 上 ， 它 已 经 成 了 程序 员 中 的 -一 个 经 典 都 市 
传奇 总 较 权 威 的 说 法 ,出 日 Fred Webb, 他 当时 在 NASA 工作 并 在 到 了 实际 的 涛 代码 。 具 体内 容 见 “Fortran Story 一 -The Real 
Scoop”， 它 摘 日 Fomem on risks io the Pnblic in Computers and Related Systems, 第 9 巷 ， 第 54 导 ，ACM 计算 由 和 公 愉 政策 委员 
会 ，1989 年 12 月 1211. 

” Mecury 是 NASA 登 月 计划 3 个 阶段 中 的 第 一 个 ， 只 外 两 个 尾 Gemini 和 Apollo。 一 一 泽 者 注 
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显然 ， 程 序 员 的 原意 是 想 编 气 下 面 这 样 的 循环 : 

Do 10 I = 1,10 

在 Fortran 中 ， 空 白 学 符 没 有 什么 意义 ， 它 们 甚至 可 以 在 相识 符 的 内 部 出 不 。Fortran 
的 设计 者 的 初衷 起 这 样机 以 避 统 因 打 卡 机 的 振动 而 产生 的 错 谋 ,提高 程序 的 可 靠 性 ,所 以 ， 
你 可 以 使 用 像 MAX YY 这 样 的 标识 符 。 但 不 李 的 起， 编 详 器 白 作 脱 明 地 把 上 而 这 条 语句 理 
解 成 : 

polor = 1.10 

在 Fortran 中 ， 灾 量 无 需 声 明 即 可 使 用 。 在 上 面 这 条 诸 名 中 ，1.10 被 研 值 给 隐 式 声明 的 浮 
点 型 变量 DO10I; -个 循环 结构 中 ， 但 它 只 执行 了 1 次 而 不 是 预期 的 10 次 。 
它 只 是 在 第 -次 给 出 - 个 近似 值 ， 而 不 是 通过 友 代 法 乏 步 求 精 。 盛 句号 改 成 去 号 后 ， 计 算 结 
果 的 精度 就 与 预期 的 相符 了 。 

这 个 Bug 发 岗 得 旱 , 央 此 并 不 像 许多 人 声称 的 那样 兽 经 导 敏 Mercury 太空 飞行 失败 (本 
草坪 后 所 描述 的 Mariner 行 项 目 中 的 为 一 个 Bug， 确 实 导 致 了 这 个 后 打 )， 亿 它 确 实生 
动 地 说 明了 语言 设计 的 重要 性 。 在 C 语言 中 ， a ple esl/ 有 全 村 人 
处 。 本 章 描 述 了 上 和 其 中 一 个 最 容易 出 错 的 典型 例 茸 ， 并 只 说 明了 为 什么 它们 遂 常 Bus 
看 待 。 汉 然 ， 在 C 诸 言 1! 也 可 能 出 现 其 他 问题 。 例 如 ， 无 论 在 什么 时 候 ， 如 果 遇 见 了 这 
样 “条 语句 malloc(strlen(stm);， 几 乎 可 以 断定 它 是 错误 的 ， 而 malloc(strlen(str)+1) 才 本 
确 的 。 这 是 内 为 其 他 的 字 人 等 串 处 理 库 函 数 儿 乎 都 包含 一 个 额外 空间 ， i 和 
的 “0” 字符， 所 以 ， 估 们 很 容易 忽略 strlen 这 个 特殊 情 ! 
个 malloc 错误 是 库 涡 数 包 问题。 但 是 ， 椒 章 的 重点 起 C 语言 本 身 存在 的 问题， 而 不 是 和 
序 员 在 使 用 中 存在 的 问题 。 

分 析 编 程 语 吝 缺陷 的 -- 种 方法 就 是 把 所 有 的 缺陷 归于 3 类 : 不 洲 做 的 做 了 ; 该 做 的 没 做 : 
该 做 但 做 得 不 合适 。 为 了 方 使 起 见 ， 我 们 分 别 把 它们 称 作 “ 多 做 之 过 和 水 “ 少 做 之 过 ”和 “ 误 
做 之 过 ”。 接 下 来 的 儿 个 小 闻 我 们 就 按照 这 种 分 类 方法 探讨 C 语言 的 特性 。 

本 章 并 不 是 想 对 C 语言 进行 致命 打击 。C 是 一 门神 奇 的 编程 语言 ， 其 有 许多 优点 。 它 是 
种 非常 流行 的 实现 语言 ， 被 许多 平台 所 选用 ， 而 它 确实 也 值得 人 们 如 此 看 重 。 但 是 ， 正 如 
我 的 祖母 曾 说 过 的 那样 ， 当 在 超 导 en 子 也 不 撞 碎 。 所 以 
在 欣赏 C 语言 的 优点 时 也 人 要 忘 了 分 析 一 下 它 的 缺陷 。， 进步 是 计算 机 软件 工程 和 编 
程 语言 设计 艺术 逐步 发 展 的 重要 动因 。 这 也 是 为 什么 es 它 对 CG 语言 
中 存在 的 - 些 最 基本 问题 深 有 什么 改进 ， 而 它 对 C 语言 最 重要 的 扩展 〈 类 ) 却 是 建立 在 脆弱 
的 C 类 型 模型 上 。 所 以 , 木 着 改进 林 来 编程 详 志 的 探索 精神 ,证 我 们 对 CC 语言 进行 望 闻 问 切 ， 
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一 个 “L” 的 NUL 和 两 个 “L” 的 NULL 


牢记 下 面 的 话 ， 它 有 助 于 回忆 指针 和 ASCII 码 零 的 正确 术语 : 

一 个 4L 的 NUL 用 于 结束 一 个 ACSII 字符 串 ， 

两 个 ‘L 的 NULL 用 于 表示 什么 也 不 指向 ( 空 指针 ) 。 

当然 ， 如 果 出 现 了 三 个 和 ”的 NULLL， 那 就 要 检查 一 下 有 没有 拼写 错误 了 。ACSII 字 
符 中 零 的 位 模式 被 称 为 “NUL” 。 表 示 哪 里 也 不 指向 的 特殊 的 指针 值 则 是 “NULL'” ,这 两 
个 术语 不 可 互 换 。 


PP TA TIT Raa A 


2.2 多 做 之 过 


“多 做 之 过 ”， 就 是 语言 中 存在 某 些 不 应 该 存在 的 特性 。 这 些 特性 包括 容易 出 错 的 switch 
语 何 、 相 邻 字 符 囊 常 景 的 白 动 连接 和 缺 省 全 局 范围 


2.2.1 由 于 存在 fall :hrough，switch 语句 会 带 来 麻烦 


switch 语句 的 一 般 形 工 如 下 ; 
switch (表达 式 ) 1{ 
case 常量 表达 式 : 替 条 或 多 条 语句 
default: 需 条 或 多 条 语 向 
case 常量 表达 式 : 雷 条 或 多 条 语句 
} 
每 个 case 结构 由 3 个 部 分 组 成 :关键 字 case; 紧 随 其 后 的 常 景 值 或 常量 表达 式 ， 再 紧 接 
一 个 冒号 。 当 表达 式 的 们 与 case 中 的 常量 匹配 和 村， 该 case 后 面 的 语句 就 会 执行 。default (如 
果 有 的 话 ) 可 以 出 现在 case 列表 的 任何 位 置 ， 它 在 其 他 的 case 均 无 法 号 配 时 被 选中 执行 。 如 
果 没 有 default， 向 日 所 有 物 case 均 不 匹配 ， 那 条 整 条 switch 诸 句 便 什么 都 不 做 。 许 多 人 可 能 
觉得 如 果 所 有 的 case 均 不 匹配 ， 应 该 给 出 一 个 运行 时 错误 信息 ， 提 示 “ 无 匹配 ”， Pascal 语 
言 谨 是 这 样 做 的 。 | 在 CC 语言 中， 儿 进行 运行 时 错误 检查 上 一 对 进行 解除 引用 操作 的 
指针 进行 有 效 性 检查 大 概 是 惟一 的 例外 , 而 且 和 在 MS-DOS 系统 里 其 至 也 这 点 很 有 限 的 检查 都 
无 法 保 让 。 
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MS-DOS 的 运行 时 检查 


无 效 的 指针 可 能 成 为 程序 员 的 恶 梦 。 人 和 们 很 容 多 用 一 个 无 效 的 指针 来 引用 内 看。 在 所 有 
的 虚拟 内 存 体系 结构 里 ， 一 - 旦 一 个 指针 进行 解除 引用 操作 时 所 引用 的 内 存 地 址 超出 了 虚 专 内 
存 的 地 址 空间 、 抒 作 系统 就 会 中 止 这 个 进程 . 但 MS-DOS 并 不 支持 虚拟 内 存 ， 即 使 内 存 访问 
失败 ， 它 也 无 法 立即 捕捉 至 | 这 种 情况 。 

然而 ,在 MS-DOS 中 可 以 动 点 小 脑筋 ， 在 程序 结束 之 后 检测 解除 引用 室 指 针 的 情况 ,在 
Microsoft 和 Borland C 中 都 采用 了 这 方面 的 办 法 。 上 有 具体 方 法 是 在 进入 程序 前 ， 保 存 内 耕地 址 
替 的 值 ， 在 程序 结束 时 ， 系 统 检 查 这 个 地 址 的 值 与 原 光 的 是 否 相 同 。， 如 果 不 同 ， 基 本 可 以 肯 
定 你 的 程序 使 用 了 空 指针 来 访问 内 存 , 运行 时 系统 会 打印 出 一 条 “null pointer assignment ( 空 
指针 赋值 ) ”信息 。 

关于 这 方面 的 内 容 ， 第 了 章 有 进一步 的 柑 述 。 


运行 时 检查 与 C 语言 的 设计 理念 相 违 背 。 按照 C 话 言 的 理念 ， 程 序 员 应 该 知道 白 己 正 在 





什么 ， 而 且 保 证 自己 的 访 作 所 为 是 止 确 的 。 

各 个 case 和 default 的 顺序 可 以 是 任意 的 ， 但 习惯 上 总 是 把 default 放 在 最 后 。 个 遵循 
标准 的 C 编译 器 至 少 允 诗 -- 条 Switch 诸 句 中 有 257 个 case 标签 CANSIC 标准 ,第 5.2.4.1 节 )。 
这 是 为 了 允许 switch 满足 一 个 8 bit 字符 的 所 有 情况 (256 个 可 能 的 值 如 上 EOF )。 

switch 存在 一 些 问题 ， 其 中 之 一 -就 是 它 对 case 可 能 出 现 的 值 太 过 于 放纵 了 ， 例如: 可 以 
企 switch 的 左 花 括 号 之 后 声明 一 些 挛 量 , 从 而 进行 一 些 局 部 存储 的 分 起 ,在 最 初 的 编 详 器 里 ， 
这 起 一 个 技 雹 一 一 绝 大 多 数 用 于 处 理 任何 复合 语句 的 代码 都 可 以 被 复 用 ， 吕 以 用 于 处 理 
switeh 语句 中 由 花 括 号 包 住 的 那 部 分 代码 。 所 以 在 这 个 位 痹 上 上 声明 一 此 变量 会 被 编译 器 很 自 
然 地 接受 ， 尽 管 在 switch 语句 中 为 这 些 安 量 加 上 初始 值 是 没有 什么 用 处 的 ， 因 为 它 绝 不 会 
执行 一 一 语句 从 匹配 胡 达 式 的 case 开始 执行 。 











需要 一 些 临时 变量 吗 ? 把 它 放 在 块 的 开始 处 ! 


在 C 语 言 中 ， 当 建立 一 个 块 时 ， 一 般 总 是 这 样 开 始 的 ; 
{ 
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语句 


你 总 是 可 以 在 两 者 之 司 增加 一 些 声 明 ， 如 : 
{ 
声明 
语句 
当 分 配 动态 内 存 代 价 超 高 时 ， 你 可 能 会 采用 这 种 局 部 存储 的 方法 ， 但 有 可 能 的 话 要 尽量 
避免 ,编译 器 可 以 自由 地 六 略 它 ， 它 可 以 通过 肖 数 调用 来 分 配 所 有 局 部 块 需要 的 内 存 空间 。 
另 一 种 用 法 是 声明 一 些 完全 局 部 于 当前 块 的 变量 。 
itta > b} 
fx 交换 a，b */ 
{ 
int temp = as 
a = br b= np 
} 
CH+ 在 这 方面 又 进 了 一步， 克 许 语 色 和 声明 以 任意 的 顺序 交叉 出 现 ， 甚 至 允许 变量 的 声 
明 出 现在 for 表达 式 的 内 六。 


下 GT 下 


如 果 不 加 限制 地 使 用 ， 可 能 会 带 来 一 些 混乱 ， 


switch 的 男 一 个 问题 基 它 内 部 的 任何 语句 都 可 以 加 上 标签 ， 并 在 执行 时 跳 转 到 那里 ， 这 
就 有 可 能 破坏 程序 流 的 结构 化 : 
Switch { 
Case 5 + 3: do_acdain:; 
Case 2: printfi"I loop unremittingly\n}; goto do._again; 
default: i+t+; 


CaSe 3: } 


} 

所 有 的 case 都 是 可 选 的 ， 任 何 形式 的 庄 句 -一 包括 带 标签 的 计 句 都 是 允许 的 。 这 就 意味 
者 有 些 错 误 甚 至 连 iint 程序 也 可 能 无 法 检测 出 来 。 有 -次 , 我 的 一 位 同事 打 错 了 字 , 把 default 
打 成 了 default《〈 误 把 字母 1” 打 成 数字 “1” )。 要 查 出 这 个 错误 实在 是 太 困难 了 ， 它 的 实际 
效果 相当 于 default 子 句 根本 不 存在 于 switch 语句 中 。 但 是 ， 它 能 顺利 通过 编译 ， 不 会 显示 错 
误 信息 ， 即 使 仔仔 细 细 地 把 源 代 码 看 一 遍 ， 也 找 不 出 任何 蹊跷 。 绝 大 多 数 lint 程序 都 无 法 检 
测 到 这 个 错误 。 

顺便 提 一 句 ， 由 于 在 C 语言 中 ，const 关键 字 并 不 真正 表示 常量 ， 如 ， 


const int two = 2; 


Swi=cchti) { 
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cass 1: prinLft"cise 1\n"})} 
Case two: printLil'case 2\n"); 
werror** "~ jnteyradr COILIStant expression txpcectead 
case 3: printfl"case 3\n")} 
defaulr: ， 
} 
止 面 的 代码 将 产生 - -个 如 上 所 示 的 编译 错误 。 这 并 不 起 switch 语句 本 上 映 的 过 错 ， 但 这 条 
switch 语 创 展示 了 const 其 实 并 不 是 真正 的 常量 。 
也 许 switch 语句 最 大 的 缺点 是 它 不 会 在 每 个 casc 标 竺 后面 的 语句 执行 党 毕 后 自动 中 止 。 
一 有 旦 执行 某 个 case 语句 ， 程 序 将 会 依次 执行 后 面 所 有 有 欧 case， 除 非 遇 到 break 语句。 下 述 代 
码 : 
swilch{2) { 
case 1; printf ("case 1\n");: 
Case 2; printf{t"case 2\n"); 
Case 3: printflt'"case 3\n")} 
case 4; printflirsase 4\n"); 
default: printff"aefault \n'}; 
} 


其 输出 结果 将 是 : 
Case 2 

忆 肌 SBC 3 

cAase 4 

defailt 


这 称 之 为 “fall through”， 它 的 意思 是 :如果 case 语句 后 面 不 加 break， 就 依次 执行 下 去 ， 
以 满足 某 些 特殊 情况 的 要 求 。 但 实际 上 ， 这 是 .一 个 非常 不 好 的 特性 ， 因 为 几乎 所 有 的 case 部 
帘 要 以 break 结尾 。 大 部 分 jint 程序 在 发 现 “fall through” 情 况 时 其 全 会 发 出 警告 信息 。 





缺 省 采用 “fall through”， 在 97% 的 情况 下 都 是 错误 的 


我 们 分 析 了 Sun 的 C 编译 器 ， 想 看 看 缺 省 的 “fall through” 的 使 用 频率 。Sun ANSIC 编 
译 器 的 前 端 共有 244 条 switch 语句 ， 平 均 每 条 含有 7 了 个 case。 在 所 有 的 case 中 ， 采 用 “fall 
through” 的 只 占 3%。 

换 加 话说 ，switch 语 引 的 缺 省 行为 在 97% 的 情况 下 都 是 错误 的 。 并 不 仅仅 在 编译 器 中 如 
此 ， 事 实 上 ， 在 编译 器 的 switch 语 向 里 使 用 “fall through” 的 概率 要 大 于 其 他 的 软件 ， 例 如 ， 
在 编译 可 能 具有 一 个 或 两 小 操作 数 的 操作 符 时 ， 
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switchlaperator->r im_of_operands} { 
Cdase 2: process operand{operator->operand 2}; 
Fal: slrGuglh #7 
ase 1: process_operandioperatoryd>operangd_ 1);， 


由 于 case 的 “fall thrcugh” 被 如 此 广泛 地 认为 是 一 个 缺陷 ， 由 此 其 至 出 现 了 一 个 特殊 的 
注释 约定 ， 如 上 所 示 ， 它 告 诉 lint 程序 ， 现在 的 “fall through” 是 处 于 3% 正 确 的 时 候 . 这 种 
缺 省 的 “fall through” 所 膏 来 的 不 方便 被 许多 程序 所 证 实 ， 


我 们 认为 ，C 语言 的 设计 中 把 “fall through” 作 为 Switch 的 缺 省 行为 是 一 个 失误 。 在 斥 
倒 多 数 的 情况 下 ， 你 不 希望 这 个 缺 省 的 行为 而 不 得 不 加 上 一 条 额外 的 break 诸 句 米 改 变 它 。 
止 如 Throngh the Looking Ciass 中 Red Queen 对 Alice 所 说 的 ， 即 使 两 个 都 用 到 了 ， 也 不 能 说 
明 它 号 是 正确 的 。 


switch 的 另 一 个 问题 -一 break 中 断 了 什么 


下 面 这 段 代码 是 从 AT&T 的 电话 服务 程序 中 摘录 下 来 的 , 这 段 代码 曾 在 全 国 范围 内 造成 
AT&T 电话 服务 的 停顿 。 从 1990 年] 月 15 日 下 午 起 ， 大 约 有 9 个 小 时 ，AT&T 电话 网 络 的 
大 部 分 都 处 于 竣 痰 状态 。 当 时 的 电话 交换 ( 行业 用 语 是 “switch system ( 交换 系统 ) ” ) 都 
采用 了 计算 机 系统 ， 而 这 段 代码 运行 于 4ESS 型 Central Office Switching System ( 中 央 办 公交 
接 系 统 ) 。 它 证 明了 在 C- 辣 言 中 ， 人 们 太 容 易 低估 “break” 语 向 对 控制 结构 的 影响 。 


network codet{)} 
\ 
switch{line}t 
Case THINGL : 
doit1l({(); 


break; 
Case THING2, 
if{x == '3TUFF) 1{ 
do_first_stuff ():; 


iftty == OTHER_STUFF) 
brear; 
do_later_stuff{}); 
}】 /* 代 码 的 意图 是 跳 到 这 里 .….…*/ 
initialize_modes_puinter({); 
break; 
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detault: 
Prococssingl); 
; /* ... 但 事实 上 跳 到 了 这 里 ，*/ 
use_modaes_pointler(}; /* 致使 nodes-pointer 未 初始 化 */ 

} 

我 对 代码 作 了 一 些 简 心 ， 但 用 于 说 明 这 个 Bug 已 经 足够 了 。 那 个 程序 员 希 望 从 “jfP" 语 
名 跳出 , | 但 他 却 忘 了 breal: 语句 事实 上 跳出 的 是 最 近 的 那 层 循 环 语句 或 switch 语句 ,| 现在 ， 
它 跳 出 了 Switch 语句 ， 然 后 执行 use_modes_pointer(): 这 条 语句 。 但 是 ， 必 要 的 初始 化 工作 并 
未 完成 ， 为 将 来 程序 的 失 政 埋 下 了 伏笔 。 

这 段 代码 最 终 导 致 了 AT&T 114 年 的 历史 上 第 一 次 重大 的 网 络 故障 ， 这 次 事件 的 详细 报 
道 刊 登 于 1990 年 1 月 22 日 Telephony 杂志 的 第 上 | 页 . 事实 上 ， 网络 信 号 系统 的 这 个 设计 失 
误 引 起 了 一 连 串 的 反应 ， 逆 终 导 致 了 整个 长 话 网 络 的 竣 烽 。 而 这 一 切 ， 都 归 因 于 C 语言 中 的 
一 条 Switch 语 避 ， 
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2.2.2 粉笔 也 成 了 可 下 的 硬件 


ANSIC 引入 的 男 一 个 新 特性 是 相 邻 的 字符 串 常 量 将 被 白 动 合并 成 一 个 字符 趾 的 约定 .这 
就 省 掉 了 过 去 在 书写 多 行 信息 时 必须 在 行 末 加 “\” 的 做 法 ， 后 续 的 字符 捉 串 以 出 现 丁 每 行 的 
开头 。 

上 风格 : 

printf( " favorite chilaren's book 、 


is ‘muffy Gets lt; the hilarious tale of a cat,\ 
a boy, and his machine gun’"); 


现在 可 以 用 一 连 串 相 邻 的 字符 串 常量 来 代替 它 ， 它 们 会 在 编译 时 自动 合并 。 除 了 最 后 
个 字符 串 外 ， 其 余 每 个 字符 串 末 尾 的 0" 字符 会 被 自动 删除 。 

新 风格 : 

prin-f{"A second favorite children's book" 


"is ‘Thoms the tank engine and the Naughty tnginedriver who' 
"tied down Thomas's boiler safety valve''); 


然而 ， 这 种 自动 合并 意味 着 字符 串 数 组 在 初始 化 时 ， 如 果 不 小 心 漏 控 了 一 个 地 号 ， 编 详 
礁 将 不 会 发 出 错误 信息 ， 而 是 悄 无 声息 地 把 两 个 字符 串 合 并 在 - -起 。 这 在 下 面 的 例子 里 将 引 
起 可 怕 的 后 果 ， 

char *available resouces[] = { 


"COLor monitor:, 
"big disk", 


"Cray，  /* 哇 | 少 了 个 迅 号 。 
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"on-line drawing ro.thines", 


"MOUSE", 
"keyboard", 


"power cables"， /* 这 个 多 余 的 逗号 会 引起 什么 问题 吗 ? 

}} 

这 样 ，available_resorrce[2] 就 成 了 “Crayon-line drawing routines”。 这 跟 诛 先 的 意 由 大 机 
庭 答 ， 粉 笔 (crayon) 澡 也 成 了 翁 件 资源 ! 

宁 符 忠 的 数 日 比 预 期 的 少 了 一 个 。 这 样 ， 如 果 在 程序 中 侯 改 了 available_resouce[61]， 王 
等 于 修改 了 其 他 的 安 星 。, 响 使 所 一 铝 ， 最 后 那个 字符 串 末 尾 的 逗号 并 不 起 打字 错 谋 ， 而 是 从 
最 早 的 5 诸 法 中 继承 下 来 的 东西 ,不管 存 企 与 否 都 没有 什么 意义 。ANSIC rationale 对 它 进行 
了 辩护 , 称 它 使 C 语言 在 自动 生成 (automated generation) 时 更 加 容易 一 些 , 我 想 ， 这 种 拖 尾 已 
各 扎 如 果 在 其 他 出 逗 扎 分隔 的 列表 《〈 如 校 举 声明 、 单 行 多 变量 声明 等 ) 中 也 允许 使 用 ， 那 还 
阅 得 过 去 ， 吕 惜 事实 并 非 如 此 。 





本 提示 展示 了 一 种 简单 的 方法 ， 使 一 段 代 码 第 一 次 执行 时 的 行为 与 以 后 执行 时 不 同 ， 
下 面 的 肖 数 在 第 一 次 抉 行 时 ， 其 行为 与 它 以 后 执行 时 的 行为 不 同 。 要 达到 这 个 目的 ， 还 
有 几 种 方法 ， 但 这 种 方法 能 使 分 支 和 条 件 测 试 威 少 到 最 小 程度 ， 
generate,_ initializer (char * string} 
{ 
static char separator = /1 
printf{ "g%C %s ‘nNn', separator, stiring); 


separator = ',", 


} 

在 第 一 次 执行 时 ， 阴 激 首 先 打 印 一 个 空格 ， 然 后 打印 一 个 初始 化 字符 串 。 所 有 后 续 的 初 
始 化 字符 串 (如果 有 的 话 ; 的 前 面 将 加 上 一 个 这 号 。“ 第 一 次 执行 的 前 面 加 个 空格 ” 相 比 “最 
后 一 次 执行 ， 省 略 和 过 号 后 起 ” 对 程序 而 言 更 简单 了 ， 


这 个 辩护 理由 很 难 让 人 相信 ， 因 为 对 于 自动 的 程序 ， 可 以 通过 卢 明 静态 变量 ， 初 始 为 空 
格 ， 以 后 变 为 喜 苇 《如 上 面 的 小 局 发 栏目 所 示 )， 这 样 就 能 控制 逗号 的 输出 与 否 了 。 这 种 拖 尾 
逗号 将 会 抑制 正确 的 行为 ， 对 程序 也 没有 好 处 。 在 C 语 寺中 另外 人 还 有 一 些 由 去 号 分 隔 的 项 上 
的 例子 ， 它 们 并 不 用 远 号 来 结束 列表 。 这 种 曾 蛇 添 足 的 拖 尾 逗号 在 大 部 分 情况 下 只 会 把 水 搅 
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尝 ， 使 代 玛 的 品读 性 灾 薄 。 

2.2.3 大 多 的 缺 省 可 见 性 

定义 C 叱 数 时 ， 在 缺 答 情况 下 函数 的 名 字 是 全 局 可 见 的 。 可 以 在 函数 的 名 字 前 加 个 宛 余 
的 extern 关键 字 ， 也 可 以 不 加 ， 效 果 是 一 样 的。 这 个 冰 数 对 于 链接 公 它 所 在 的 目标 交 件 的 任 
何 东 西 都 是 可 见 的 。 如 果 想 限制 对 这 个 冰 数 的 访问 ， 就 必须 加 个 static 关键 字 。 


functjon applet) 1 /* 在 和 任何 地 方 均 可 见 */ } 
extern function peaerl;) { /* 在 任何 地 方 均 可 见 #/ ; 


static tunction turnip() { /* 谋 这 个 文件 之 外 不 可 见 */] 

事实 上 ， 几 乎 所 有 人 部 没 有 在 函数 名 前 洲 加 存储 类 型 说 明 符 的 习惯， 所 以 绝 大 多 数 函数 
都 是 全 局 叮 见 的 。 

根据 实际 经 验 ， 这 种 缺 省 的 全 局 可 见 性 多 次 被 证 册 是 个 错误 ， 这 已 是 盖 棺 定论 。 软 件 对 








象 在 大 多 数 情 况 下 应 该 缺 从 地 采用 有 限 可 见 性 」 当 程序 员 需 要 让 它 全 局 可 抑 时 ， 应 该 采用 品 
式 的 手段 。 

这 种 太 大 范围 的 全 局 可 见 性 会 与 C 语言 的 另 :个 特性 相互 产 牛 影响 ， 那 就 是 
interpositioning。interpositioning 就 是 用 户 编写 和 库 函 数 同 名 的 函数 并 取而代之 的 行为 。 许 多 
C 程序 员 宛 全 没有 注意 过 这 个 特性 ， 关 于 这 方面 的 纳 节 将 在 第 5 竟 讨 论 链接 时 详 述 。 现 在， 
你 的 脑子 旦 只 要 这 样 想 ;“: 关 于 interpositioning， 我 还 需 监 学 习 很 多 东西 。” 

范围 过 宽 的 问题 常见 于 库 中 : 一 个 库 需 要 让 一 个 对 象 在 另 一 个 库 中 可 网。 惟 的 方法 是 
让 它 变 得 全 局 可 见 。 但 这 学 一 来 ， 它 对 于 链接 到 该 库 的 所 有 对 象 都 是 可 见 的 了 。 这 就 是 
“all-ornothing” 一 一， 一 个 符号 要 么 全 局 可 见 ， 要 么 对 其 他 文件 部 不 可 见 。 在 C 放言 中 ， 对 
信息 可 见 性 的 选 拌 就 起 这 么 有 限 。 

由 于 你 无 法 像 在 Pascal 中 那样 ， 在 一 个 图 数 内 部 嵌 套 男 一 个 函数 的 定义 ， 使 这 个 问题 变 
得 更 加 粮 灯 。 一 个 大 型 琢 数 的 - 群 “ 内 部 ”函数 不 得 不 在 该 盟 数 的 外 部 进行 定义 。 没 有 人 会 
记得 在 它们 之 前 加 上 static 梢 定 符 ， 所 以 它们 在 缺 省 情况 下 是 全 局 可 见 的 。Ada 利 Modula-2 
语 关 使 用 一 种 易于 处 理 的 方法 来 解决 这 个 问题 ， 就 是 在 各 个 程序 单 蕊 中 十 确 说 明 哪些 符号 是 
引入 的 ， 哪 些 是 引出 的 。 


2.3” 误 做 之 过 
C 语言 中 属于 “ 误 做 之 过 ”的 特性 ， 就 是 语言 中 有 误导 性 质 或 是 不 适当 的 特性 、 这 些 特 
性 有 经 眠 C 语言 的 简洁 有 关 〔 部 分 与 符号 的 过 度 复 用 有 关 )， 有 些 则 与 操作 符 的 优先 级 有 关 。 
2.3.1 骆驼 背 上 的 重 载 
C 语言 存在 的 一 个 问题 就 是 它 太 简洁 了 ， 仅 增加 、 修 改 或 删除 -- 个 字符 就 会 使 诛 先 的 程 
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序 变 成 恤 外 一 个 仍然 有 效 却 全 然 不 同 的 程序 。 更 糟 的 是 ， 许 多 符号 是 被 “ 重 载 ”的 一 一 在 不 
加 的 上 下 文 环境 电 有 不 同 的 意义 。 甚 至 有 些 关 键 和 学 也 被 条 载 而 其 有 好 儿 种 意义 ， 这 也 契 C 语 
千 的 范 国 规则 对 程序 员 不 那么 清晰 的 主要 诛 肉 。 表 2-1 展示 了 C 语言 中 类 似 的 符 吕 是 如 何 且 
三 多 种 不 同意 义 的 。 


表 2-1 C 语言 中 的 等 号 重 载 
符 号 意 总 





static ”| 在 衣 数 内 孝 ， 懈 示 该 变量 的 值 在 各 个 调用 间 “ 直 保 持 延 续 性 
在 函数 这 -级 ， 胡 去 该 访 数 只 对 本 文件 nf 见 

extern | 用 十 冰 数 定义 ， 表 示人 全 局 可 见 〈 属 于 元 余 的 ) 

用 于 变 最 ， 胡 云 它 在 其 他 地 方 定义 

作为 函数 的 返 电 类 进 ， 表 示 不 返回 任何 值 

在 指针 声明 中 ， 表 示 通 用 指针 的 类 开 

位 二 参数 列表 中 ， 表 示 没有 参数 

乘法 运算 符 

用 丁 指针， 间接 引用 

在 声明 中 ， 表 汗 指 针 

位 的 AND 操作 等 

取 地 址 壤 作 符 























比较 运算 符 
小 十 等 村 运 算 等 

左 移 复合 赋值 运算 符 
小 于 运算 符 
坟 nclude 指令 的 左 定 界 符 

在 函数 定义 中 ， 包 图 形式 参数 表 。 
调用 一 个 学 数 。 

改变 表达 式 的 运算 次 序 。 

将 值 转换 为 其 他 类 型 (强制 类 型 转换 ) 。 
定义 带 参数 的 宏 。 

包围 sizeof 操作 符 的 操作 数 如果 它 是 类 型 名 ) 














除 此 之 外 ， 偿 有 -- 些 符号 具有 多 个 容易 混淆 的 意思 。 有 - -位 心 虹 没 底 的 程序 员 曾 对 
这 x>>4) 这 样 的 语 何曾 经 感到 困惑 ， 问 道 “ 这 是 什么 意思 ? 它 是 不 是 表示 x 远 远大 于 4? ” 


” 你 可 能 会 奇怪 static 的 意义 会 相 其 如 此 之 大 ， 如 果 你 知道 原因 ， 也 请 告诉 我 - 声 。 
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重 载 存在 问题 之 处 如 下 和 面 的 语句 所 未: 

DP=N* sizeof * gq} 

你 能 不 能 马上 推断 出 ， 这 里 起 一 个 乘 号 还 是 两 个 ?提示 : 接 下 去 的 一 条 语句 十 ; 

tT = molloct{p); 

答案 是 这 里 只 有 一 个 狠 号 ， 因 为 sizeof 操作 符 把 指针 a 指向 的 东 点 【 蔬 *q) 作为 操作 数 ， 
它 返 同 q 所 指向 对 象 的 类 型 的 字 节 数 ， 便 于 malloc 图 数 分 配 内 存 。 当 sizeof 的 操作 数 是 个 类 
型 名 时 ,两 边 必 须 加 上 括 叶 【这 常常 使 人 误 以 为 它 是 个 国 数 )， 得 操作 数 如 果 是 变量 则 不 必 加 
括号 。 

这 里 有 - -个 吏 为 复杂 的 例子 : 

apple = sizeof (int. * p; 

这 代表 什么 总 因 ? 是 int 的 长 度 乘 以 p? 或 者 是 把 未 知 类 型 的 指 旬 p 强制 转换 为 int， 然 
后 进行 sizeof 操作 ?或 者 闪 有 其 他 更 奇怪 的 解释 ?这 里 没有 给 出 答案 ， 要 想 成 为 一 位 熟练 的 
程序 员 ， 必 须要 自己 编写 测试 程序 探索 这 类 问题 。 请 试 试 吧 ! 看 看 是 什么 结果 。 

你 让 一 个 符号 所 表达 蚀 意 思 越 多 ， 编 译 器 就 越 难 检测 到 这 个 符号 在 你 的 使 用 中 所 存在 的 
异常 情况 。 这 并 不 像 那些 有 烦恼 的 人 那样 在 迪斯尼 东 园 与 奇异 鸟 一 起 歌唱 就 可 解除 烦恼 。C 
语言 似乎 比 其 他 语言 更 靠近 标记 歧义 性 的 曲折 边缘 。 

2.3.2 “有 些 运算 符 的 优先 级 是 错误 的 ” 

当 C 语言 最 初 文献 的 作者 告诉 你 " 有些 运算 符 的 优先 级 是 错误 的 "的 时 候 , 就 像 Kermighan 
和 Ritchie 在 The C Programming Language 第 3 页 中 所 说 的 帮 样 ,你 肯定 会 觉得 确实 存在 问题 。 
尽管 如 此 ， ANSIC 在 修改 运算 符 优先 级 方面 并 没有 采取 什么 动作 , 这 也 毫 不 育 怪 ， 因 为 如 果 
对 运算 符 的 优先 级 作 了 悠 点， 那么 大 量 现 有 的 代码 就 会 出 现 问 题 。 

但 是 ， 到 底 是 哪些 C 运算 符 存 在 错误 的 优先 级 呢 ? 答案 是 “ 当 按 照常 规 方式 使 用 时 ， 可 
能 引起 误会 的 任何 运算 符 ”。 有 些 常常 会 给 不 注意 的 人 带 来 麻烦 的 运算 符 扎 表 2-2。 

表 2-2 C 语言 运算 符 优先 级 存在 的 问题 

优先 级 问题 人 们 可 能 误 以 为 的 结果 
















.的 优先 级 高 于 *。 P 所 指 对 象 的 字段 f 对 p 取 f 偏 移 ， 作 为 指针 ， 
-> 操作 符 用 于 消除 这 Cp)f 然后 进行 解除 引用 操作 。 






*(P 全 
ap 是 个 元 素 为 int 指针 的 数组 
int *(ap[]) 
二 是 个 际 数 ， 返 国 imt* 
int *(fpO) 








个 问题 
日 高 十 * 














ap 是 个 指向 int 数组 的 指针 
int(*ap)[] 

fp 是 个 隔 数 指针 ， 所 指 昭 数 
返回 int。int(sfp)0 


int #ap[| 












商 数 () 高 于 * int *fpC 
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续 表 






人 们 可 能 误 以 为 的 结果 
(val & mask) !=0 
{(c = getchar)) != EOF 






优先 级 问题 











val & (mask != 0) 
c= (getcharl) != EOF) 


(val &: mask != 0} 








== 和 != 遍 于 赋值 符 





c= getchar() 
!= ECE 














算术 运算 高 于 移 位 运 | msb << 4 + lsb (msb << i) + lsb msb << (4 + lsb) 
算 符 
逗号 运算 符 在 所 有 和 运 


算 符 中 优先 级 到 低 












这 些 运 算 符 中 的 大 部 分 ， 如 果 坐 下 来 好 好 总 一 下 ， 就 会 变 得 明了 。 尽 管 有 些 涉及 过 号 的 
情况 存 时 会 让 程序 员 歇 斯 床 里 。 例 如 ， 当 下 面 代 码 执行 时 : 

i = 1, 2; 

i 的 最 终结 果 将 是 什么 ? 对 ， 我 们 知道 去 号 运算 符 的 值 就 是 最 右边 操作 数 的 值 。 但 在 这 
里 ， 赋 值 符 的 优先 级 更 高 ， 访 以 实际 情况 应 该 足 ， 

(i = 1)，2; /* 1 的 值 为 1 */ 


i 赋值 为 1， 接 者 执行 常量 2 的 运算 ,计算 结 果 丢 齐 。 最终，i 的 结果 是 1 而 不 是 2。 
在 多 年 前 Usenet 的 一 个 公告 中 , Dennis Ritchie 解释 了 这 些 不 正常 的 情况 是 如 何 册 于 历史 
的 偶然 而 产生 的 。 








“And” 和 “AND” 或 “Or” 或 “OR” 


来 源 : decvax!harpo!Inpoivlalice!research!dmr 
日 期 :Fri Oct 22 01:04:10 1982 

主题 : 操作 符 的 优先 级 

新 闻 组 : netlang.c 


久久 、|| 操 作 符 与 == 操 作 符 的 优先 级 关系 问题 是 这 样 产 生 的 。 在 C 的 早期 ， 有 度 和 必 & 合 用 
同一 个 操作 符 ，| 和 | 也 是 如 此 (明白 吗 ? ) 。 它 继承 了 B 和 BCPL 中 的 概念 “ 真 值 上 下 文 ”， 
就 是 在 让 和 while 等 后 面 涡 要 一 个 布尔 值 的 时 候 ， 及 和 | 就 被 翻译 成 现在 的 有 && 和 上 |。 如 果 它 们 
在 一 般 的 表达 式 里 ,就 被 解释 成 位 操作 符 , 也 就 是 现在 的 样子 。 这 个 机 制 操 作 起 来 没有 问题 ， 
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但 理解 起 来 很 困难 【在 真 值 上 下 文 里 ， 疗 在 “顶层 运算 符 ” 的 报 念 )， 

改 和 | 的 优先 级 跟 现 在 一 样 、 最 初 ， 在 Alan Snyder 的 俱 促 下 ， 我 在 CC 语言 中 加 入 了 及 良和 
操作 符 。 这 就 成 功 地 把 位 运算 的 概念 和 布尔 运 筑 的 概念 分 了 开 来 。 然 而 ， 我 心怀 不 安 ， 因 为 
我 意识 到 了 优先 级 的 问题 。 例 如 、 在 现存 的 大 量程 序 中 ， 存在 诸如 这 样 的 表达 式 : ifa ==b 廊 
¢ == d), 

事后 回想、 如 果 我 们 一 开始 就 政变 优先 级 ， 让 必 的 优先 级 商 于 =-=， 在 康 辑 上 可 能 更 清晰 
一 些 .、 但是， 从 安全 的 角度 出 度 ， 只 能 做 到 把 及 入 及 分 开 这 个 程度 .无 法 在 匡 者 的 优先 级 之 
间 再 插入 其 他 的 操作 符 (否则 的 话 ， 现 有 的 大 量 代 码 都 有 可 能 出 问题 ) ， 


Dennis Ritchie 





计算 的 次 


我 之 所 以 开 这 个 栏目 讨论 这 个 问题 ， 就 是 想 告 诉 你 ， 在 表达 式 中 如 果 有 布尔 操作 、 算 术 
运算 、 位 操作 等 混合 计算 ， 你 始终 应 该 在 适当 的 地 方 加 上 括号 ， 使 之 清楚 明了 ， 

记 住 ， 在 优先 级 和 结合 性 规则 告诉 你 哪些 符号 组 成 一 个 意 群 的 同时 ， 这 些 意 群 内 部 如 何 
进行 计算 的 次 序 始 终 是 未 定义 的 ， 在 下 面 的 表达 式 里 : 


x = f() + g{) * h(i); 


2() 和 h() 的 返回 值 鞠 纽 成 一 个 意 群 ， 执行 来 法 运算 , 但 g() 和 h() 约 调用 可 能 以 任何 顺序 出 
现 (g0 的 调用 不 一 定 蛙 于 h0))。 类 似 , f0) 可 能 在 来 法 之 前 也 可 能 在 来 法 之 后 调用 , 也 可 能 在 g() 
和 h() 之 间 调 用 。 惧 一 可 以 确定 的 就 是 来 法 会 在 加 法 之 前 执行 (因为 乘法 的 结果 是 加 法 运 莫 的 
操作 数 之 一 )。 如 果 编 写 程序 时 要 依赖 这 些 意 群 计算 的 先后 次 序 ， 那 就 是 不 好 的 编程 风格 . 大 
部 分 编程 语言 并 未 明确 规定 操作 数 计算 的 顺序 。 之 所 以 未 作 定 义 ， 是 想 让 编译 器 充分 利用 自 
身 架 构 的 特点 ， 或 者 充分 和 用 存储 于 寄存 器 中 的 值 ， 
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Pascal 在 布尔 操作 和 算术 操作 进行 混合 计算 时 ， 要 求 在 志 达 式 里 加 上 显 式 的 括号 ， 从 而 
避免 了 这 方面 的 种 种 问题 . 有 些 专家 建议 和 本 C 语言 中 记 牛 两 个 优先 级 就 够 了 : 乘法 和 除法 先 
于 加 法 和 减法 ， 在 涉及 其 他 的 操作 符 时 ， 律 如 上 括号 。 我 认为 这 是 条 很 好 的 建议 。 
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“结合 性 ”是 什么 意思 ? 


操作 (运算 ) 符 的 优先 级 已 经 够 让 人 心烦 的 了 ,许多 人 对 操作 符 的 结合 性 同样 感到 困惑 ， 
在 标准 语言 的 文档 里 ,对 操作 符 的 结合 性 并 没有 作出 非常 清楚 的 解释 ， 本 栏目 将 向 你 解释 
它 到 底 是 什么 以 及 你 什么 时 候 需 要 知道 它 。 可 以 获得 满分 的 回答 是 : 它 是 仲裁 者 ， 在 几 个 操 
作 符 县 有 相同 的 优先 级 时 决定 先 执 行 哪 一 个 ， 

每 个 操作 符 拥有 某 一 圾 别 的 优先 级 ， 同 时 也 拥有 左 半 合 性 或 右 结 合 性 .优先 级 决定 一 个 
不 含 括号 的 表达 式 中 操作 激 之 间 的 “紧密 ”程度 。 例 如 ， 在 表达 式 a*b+¢ 中 ， 腾 法 运算 符 
的 优先 级 高 于 加 法 运算 符 的 优先 级 ， 所 以 先 执行 乘法 arb， 而 不 是 加 法 hb+ce， 

但 是 ， 许 多 操作 符 的 党 先 级 是 相同 的 。 这 时 ， 抬 作 符 的 结合 性 就 开始 发 挥 作用 了 。 在 表 
达 式 中 和 如果 有 几 个 优先 级 相同 的 操作 符 ， 结 合 性 就 起 件 裁 的 作用 ， 由 它 决 定 哪 个 操作 符 先 执 
行 。 像 下 面 这 个 表达 式 : 

mE a B= VD 

A =D = cc} 

我 们 发 现 ， 这 个 表达 式 只 有 赋值 符 ， 这 样 优先 级 就 无 法 帮助 我 们 决定 哪个 操作 先 执 行 ， 
是 先 执行 b=c 呢 ? 还 是 先 执 行 4=b、 如 果 按 前 者 ，4 的 结果 为 2?， 如 果 按 后 者 ，4 的 结果 为 
1. 

所 有 的 赋值 符 ( 包括 复合 赋值 符 ) 都 县 有 右 结 合 性 ， 就 是 说 表达 式 中 最 右边 的 操作 最 先 
执行 ， 然 后 从 右 到 左 依次 决 行 。 这 样 ，c 先 赋值 给 b， 然 后 b 再 赋值 给 a， 最 终 a 的 值 是 2. 





类 似 地 ， 具 有 左 结 合 性 约 操 作 符 (如 位 操作 符 “ 上 ”和 “|” ) 则 是 从 左 至 右 依次 执行 。 
结合 性 只 用 于 表达 式 中 出 现 两 个 以 上 相同 优先 级 的 操作 符 的 情况 ， 用 于 消除 歧义 。 事实 

上 ， 你 会 注意 到 所 有 优先 汲 相 同 的 操作 符 ， 它 们 的 结合 性 也 相同 。 这 是 必须 如 此 的 ， 否 则 结 

合 性 依然 无 法 消除 歧义 ，: 如 果 在 计算 表达 式 的 值 时 需要 者 虑 结合 性 ， 那 么 最 好 把 这 个 表达 式 


一 分 为 二 或 者 使 用 括号 . 








在 C 语言 中 ， 跟 顺序 有 关 的 问题 ， 有 些 定义 得 很 好 ， 如 优先 级 和 结合 人 性， 有 些 则 定义 得 
很 含糊 ， 如 大 部 分 表达 式 温 各 个 操作 数 计算 的 顺序 〈 前 其 一 节 已 经 讲述 ) 就 是 不 确定 的 ， 它 
的 日 的 是 为 了 让 编译 器 设计 者 选取 最 合适 的 方法 米 产 牛 最 快 的 代码 。 我 们 之 所 以 说 “大 部 分 ” 
是 内 为 其 些 操作 符 如 && 和 ll 等， 其 操作 数 的 计算 是 规定 顺序 的 。 这 两 个 操作 符 严格 按照 从 左 
到 右 的 嘎 序 依次 计算 两 个 操作 数 ， 当 结果 提前 得 知 时 便 忽 略 剩 余 的 计算 。 但 是 ， 在 函数 调用 
中 ， 各 个 参数 的 计算 顺序 是 不 确定 的 。 
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2.3.3 早期 gets() 中 的 Bug 导致 了 Internet 蜂 虫 


C 话 寺 的 问题 并 不 局 限于 诸 昔 本身。 标准 库 中 的 有 些 程序 也 具有 不 安全 的 语义 。1988 年 
11 月 ， 蜂 虫 程序 入 侵 了 数 十 台 接 入 Intemet 的 计算 机 ， 戏 剧 性 地 证 明了 这 :点 。 当 清除 呢 贝 
并 完成 调 友 后 ， 人 们 发 现 归 虫 款 殖 的 途径 之 就 是 通过 脆弱 的 finger 防护 进程 。 这 个 程序 对 
当前 哪些 用 户 已 经 登录 的 询问 也 照 实 同 答 。 这 个 称 为 in,fingerd 的 finger 防护 进程 ， 使 用 了 
标准 IO 库 责 数 gets()。 

getsO 也 数 趟 式 的 任务 逊 从 流 中 读 入 :个 字符 串 。 七 的 调用 者 会 会 告诉 : ee 
和 但 是 ， 2 事实 上 它 也 无 注 空间 。 妈 





finger 防护 进程 人 A 


mainlargc, argv) 
char *argvt{]; 

{ 
char line[517?]; 


Getsitline) ; 

这 里 ，line 是 个 能 容纳 512 个 字符 的 数组 ， 它 是 在 堆栈 上 自动 分 配 的 。 当 用 户 的 输入 超 
过 了 finger 防护 进程 规定 的 512 个 字符 时 ，gets0 函 数 将 会 继续 把 多 出 米 的 字符 压 天 堆栈 中 。 

如 采 黑 客 想 通过 这 些 多 余 的 宁 符 来 改写 堆栈 中 某 个 项 日 的 内 容 (并 波及 到 附近 的 项 目 )， 
绝 大 央 分 计算 机 架构 对 此 都 没有 什么 好 的 少 法 来 预防 。 如 果 对 堆栈 的 每 次 访问 之 前 都 要 检查 
其 大 小 和 访问 权限 ， 对 于 软件 米 说 代价 太 大 了 ， 根 本 不 可 行 。 如 果 你 深 知 其 中 奥妙 ， 可 以 在 
了 符 串 实 参 中 设置 正确 的 二 进 制 模 式 来 修改 堆栈 中 的 过 程 活动 记 洪 ， 改 变 两 数 的 返回 地 址 。 
结 采 ， 程 序 的 执行 流 就 不 会 返回 到 函数 调用 点 的 位 兽 ， 而 是 跳 转 到 “个 特 跌 的 指令 序列 《也 
起 精心 布 首 在 堆栈 中 的 ), 它 将 调用 execy() 肯 数 用 一 个 shell 替换 正在 运行 的 映像 程序 。 这 样 ， 
现在 就 是 与 运程 机 器 上 的 shell 对 话 ， 而 不 是 finger 防护 进程 。 你 可 以 发 布 命令 ， 把 一 份 病 毒 
的 拷贝 传播 到 其 他 的 机 器 上 。 你 可 以 不 断 地 传播 病毒 ， 直 到 被 人 发 现 并 投入 监狱 。 图 2-1 展 
不 了 这 个 过 程 。 

具有 识 刺 意味 的 是 ，gets() 函 数 是 个 过 时 的 函数 ， 用 于 和 最 初版 本 的 可 移植 的 IO 函数 库 
保持 兼容 ， 并 已 在 十 多 年 前 被 标准 WO 库 函 数 所 取代 。 在 C 语言 的 官方 手册 中 ， 强 但 建 议 用 
fgetsO 彻 底 取代 gets0。fgets() 函 数 对 读 入 的 字符 数 设 置 了 一 个 限制 ， 这 样 就 不 会 超出 缓冲 区 
范围 。 应 该 把 

Sets (line) : 


答 换 成 ; 
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第 2 章 这 不 是 Bug， 而 是 语言 特性 
i[ifgetst{tline, sizeof (line}, stdin) == NUDDI 
cxit (i}; 

现 看 ， 限 数 只 能 接受 右 限 数 革 的 字符 ， 不 会 趋 出 绥 冲 区 的 范围 。 这 样 就 不 会 出 于 其 他 人 
运行 程序 而 究 盖 堆栈 中 的 重要 区 域 。 然 而 ，ANSIC 标准 于 没有 将 gets0) 滑 数 从 标准 中 拿 掉 。 
所 以 ,尽管 对 十 这 个 特定 的 程序 米 说 是 安全 了 ， 但 隐藏 在 C 诸 言 中 的 问题 根源 却 没有 真正 消 
除 。 

痢 恶 的 湿 客 机 器 提供 finger 服务 的 machine2 





WA | 一 “" 
向 machine2 的 finger 程序 ]. tinger | | 
“非常 长 的 字符 串 ， 也 括 一 , 井 制 数据 *” 2. 从 堆栈 中 Setk( ) 它 的 参数 


3.“ 非 常 长 的 字符 申 ” 改 写 

全 人 丁玲 

5. ee 和 
同 2-1 Intemet 蠕虫 如 何 获得 远程 机 器 的 控制 特权 


2.4 少 做 之 过 


属于 “ 少 做 之 过 ”的 特性 就 是 语言 应 该 提供 但 未 能 提供 的 特性 ， 如 标准 参数 处 理 以 及 把 
lint 程序 错误 地 从 编译 器 中 分 离 出 米 。 


2.4.1 ”用户 名 中 若 有 字母 f， 便 不 能 收 到 邮件 


这 个 Bug 报告 非常 令 人 出 惑 。 它 声称 “如 果 用 户 名 的 第 一 个 字 姓 是 f， 该 用 户 就 无 法 收 
到 邮件 ”, 听 起 来 真是 难以 党 信 。 不 能 收 到 邮件 跟 用 户 名 中 的 某 个 字母 又 有 什么 关系 呢 ? 无 论 
如 何 , 用 户 名 中 的 字母 与 量 件 传送 过 程 并 没有 什么 联系 啊 ! 然而 ， 这 个 问题 出 现在 许多 地 方 。 

经 过 一 番 紧 张 的 测试 后 ， 我 们 发 现 如 果 用 户 名 的 第 个 宁 母 是 f{， 邮 件 确实 无 法 发 送 到 
他 们 那里 ! 就 是 说 ，Fred 和 Muffy 可 以 收 到 邮件 ， 但 Effie 却 无 法 收 到 。 对 源 代码 进行 检查 
后 ， 我 们 迅速 发 现 了 问题 折 在 。 

许多 人 对 ANSIC 采用 argc、argv 的 约定 向 C 程序 传递 参数 感到 惊奇 , 但 事实 就 是 如 此 。 
UNIX 的 约定 又 有 所 提升 , 达 公 了 一 个 标准 的 层次 , 但 此 时 却 成 了 这 个 邮件 Bug 的 原因 之 一 。 
这 个 mail 程序 在 先前 的 版 本 中 被 修改 成 这 么 … 个 样子 ; 
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C 专家 编程 


ifatrevw[argc 1 [3] == -°° |1| (srgvyiaxzg-2 1】 -= ‘f’ }) 
readinalil iargc, argv)l; 
el 5e 
sendmal [arygc, argv)? 
运行 mail 程序 时 ， 它 弃 可 以 发 送 服 丛 ， 也 可 以 读 取 到 达 的 邮件 。 让 一 个 程序 负责 山 项 截 
然 不 同 的 任务 有 何 忘 义 ， 我 们 和 暂时 不 必 纲 究 。 这 段 代码 的 目的 十 :查看 参数 ， 和 根据 它 的 内 容 
决定 到 底 是 读 取 邮件 还 龙 发 送 邮 件 。 它 的 分 析 方 法 有 总 像 试 探 法 : 先 二 找 能 确定 恋 取 或 发 送 
的 选项 下 和 大。 在 这 里 ， 如 果 最 后 一 个 参数 是 达 硕 开关 (也 钴 是 以 -个 连 字 符 厂 头 )， 就 可 以 确 


程序 也 是 执行 访 取 邮件 的 操作 ， 

这 就 是 程序 员 步 入 歧路 的 开始 ，C 诸 言 中 支持 的 医 壹 又 推 了 他 一 把 。 那 个 程序 员 只 是 看 
了 一 下 倒数 第 -个 选项 的 第 一 个 字符 ， 如 果 筷 是 -全 “ 扫 ， 他 就 是 认为 mail 程序 是 被 类 似 下 
各 的 命令 所 凋 用 : 

mail*-h -G -f /usr/linden/mymailbox 

在 绝 大 多 数 情 况 下 这 是 正确 的 ， 邮 件 可 以 从 mymailbox 中 读 到 ， 代 也 有 吕 能 发 生 下 而 这 
种 情况 : 

mail cifie Robert 

在 这 种 情况 下 ，mail 竹 序 的 参数 处 理 过 程 便 认 为 应 该 谈 取 邮件 而 不 是 发 送 。 有 瞧 ! 发 送 到 
第 二 个 字母 为 “f” 的 用 户 的 E-mail 不见 了 ! 要 修正 这 个 Bug 非常 简单 :$i 查 看 倒数 第 一 个 
参数 寻找 可 能 出 现 的 “六 时 ， 靖 定 人 在 筷 前 面 的 是 -个 过 字符 ， 

JE( argv[argc-1][0) == -| 


argvlargc-2] [Ui == '-’ && {argv[arge-2] [1] == ‘Fr )) 
readmail (arge, argv); 


这 个 问题 是 由 于 对 参数 的 糟 粒 解析 所 引起 的 ， 但 选项 开关 和 文件 凶 之 闻 分 类 不 清 也 起 原 
因 之 一 。 许多 操作 系统 (如 VAXAVMS) 能 够 在 程序 中 区 分 运行 时 选项 利 共 他 参数 (如 文件 匀 )， 
但 UNIX 却 不 能 ，ANSIC 也 不 能 。 





Shell 参数 解析 


不 充分 的 参数 解析 问题 出 现在 UNIX 的 许多 池 方 .要 找 出 目录 中 的 哪些 文件 是 链接 文件 ， 
你 可 能 会 输入 下 面 的 命令 : 


ls -1 | grep -> 
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这 会 产生 一 条 错误 信息 “缺少 重 定向 的 名 字 ”， 绝 大 多 数 人 役 快 就 能 明白 最 右边 的 那个 
符号 被 Shell 翻译 成 重 定 向 符 ， 而 不 是 作为 grep 程序 的 参数 ， 于 是 ， 他 们 使 用 引 吕 把 它 括 起 
来 ， 使 之 在 shell 中 不 可 见 ，- 如 下 : 

le 1 Orep = 

还 是 不 行 ! grep 程序 先 看 到 减 配 ， 然 后 把 整个 参数 翻译 为 大 于 号 的 一 种 未 知 组 合 形式 ， 
然后 退出 。 要 解决 问题 ， 闪 须 放 弃 使 用 18 命令 ， 政 用 

file -PR * ! greg nx 

许多 人 都 有 以 下 的 痛苦 经 历 : 创建 一 个 文件 、 文 件 名 以 连 字符 开头 ， 然 后 却 发 现 无 法 用 
rm 命令 把 连 字符 去 掉 。 一 种 解决 方法 是 给 出 文件 的 完整 路 径 名 ， 这 样 rm 就 不 会 把 连 字符 当 
ac 

有 些 C 程序 员 末 用 了 一 种 约定 ， 带 “--” 的 参数 表示 “从 这 蛙 开 始 ， 没 有 参数 中 选项 开 
关 ， 则 使 它 是 以 连 字符 开 汰 .” 一 种 更 好 的 解决 方法 是 把 包 裕 扔 给 系统 而 不 是 用 族 ， 和 使 川 参数 
处 理 涡 把 参数 分 战 选项 开关 和 莫 选 项 开关 黄种 ， 日 前 这 种 简单 的 argy 机 制 il 于 使 者 得 太 广 ， 
内 而 不 可 能 对 它 作 任何 修改 。 所 以 ， 请 记得 不 要 在 1990 年 以 前 的 Berleley UNIX i Effie 
发 送 邮件 咀 ! 


2.4.2 空格 一 一 最 后 的 领域 


许多 人 会 告诉 你 空格 在 C 语 关中 没有 什么 意义 ， 只 要 你 普 欢 ， 随 便 多 输入 儿 个 或 者 少 答 
入 儿 个 都 没有 关系 。 但 事实 并 非 如 此 ! 这 里 有 几 个 例子 ， 空 格 从 根本 上 改变 了 程序 的 意思 或 
程序 的 压 效 性 。 
“他 符 可 用 于 对 - 些 字 符 进行 “ 转 义 "， 包 所 newline (这 中 指 回 车 键 )。 被 转 义 的 
newline 作 有 逻辑 上 把 下 一 行当 作 当 前 行 的 延续 ， 它 可 用 十 连接 长 字符 囊 ， 如 果 人 在 “\” 和 [pl 车 
键 之 间 不 小 心 留 上 : 则 个 衬 格 就 会 晨 地 问题 newline 和 Anewline 就 不 一 样 。 这 个 错误 很 难 
被 发 讽 ， 因 为 你 是 伯 导 找 某 种 无 形 的 东西 在 访 该 是 newline 的 地 方 出 观 了 一 个 空格 ， 注 意 
newline 并 个 是 一 个 有 形 的 学 符 ， 所 以 “\” 后 面 有 没有 空格 在 实际 代码 中 根本 看 不 出 来)。 
newline 在 典型 情况 下 用 于 转 义 连续 多 行 的 宏 定 义 。 如果 你 的 编译 器 不 具备 出 类 拔 茶 的 错误 处 
理 能 力 ， 最 好 还 二 放弃 这 溃 用 法 。 转 义 newline 的 另 -种 用 处 十 延续 个 字符 串 常量， 如 下 : 
char all = "Hi! Row are you? T am quite i 
long string, foldegd onto 2 lines",; 


这 种 多 行 字符 申 常 呈 的 问题 被 ANSI C 通过 引入 相 邻 学 符 串 常量 自动 连接 的 约定 解决 。 
但 正如 我 在 本 草 的 其 他 地 方 所 指出 的 那样 ， 这 个 方法 在 解决 一 个 问题 的 同时 又 引入 了 一 个 新 
问题 。 

” 如果 将 所 有 的 空格 部 弃 之 不 用 ,也 会 聊 入 麻烦 。 例 如 ， 你 明白 下 面 的 代码 是 什么 意 忠 
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号 ? 
7 = y+++X 
程序 员 的 意图 可 能 是 = y + +Hx， 是 z= +++X。ANSIC 规定 了 一 -种 类 渐 
为 人 所 熟知 的 “maxima] nyunch strategy《 最 大 一 - 口 策略 >”。 Ce a 
超过 -种 的 解释 方案 ， a 序列 的 方案 。 以 上 面 这 个 例子 为 例 ， 忠 
将 被 解析 为 z= y++ +x。 们 这 还 是 有 可 能 陷入 贱 迷 ， 比 如 下 面 的 代码 

Z = w++++ 十 区， 

按照 前 面 的 策略 将 被 解析 为 z= Y++ +++Xx， 这 将 引起 - -个 编译 错误 ， 错 误 佑 息 是 

“++ 操 作 符 迷失 于 空格 间 ”。 即 使 编译 器 能 够 推断 〈 从 理论 二 说 ) 疏 - 有效 的 编排 方式 是 
z= y++ +++xX， 它 还 是 会 出 现 编译 错误。 

， 第 三 个 跟 空 格 有 人 的 问题 出 现在 当 程序 员 有 两 个 指向 int 的 指针 并 想 对 两 个 int 数据 
执行 除法 运算 时 ， 人 代码 如 下 : 

ratio = *x/*y; 

但 编译 器 会 给 出 一 条 销 误 信息 ， 抱 怨 出 现 了 语法 错误 。 问 题 出 在 除法 运算 符 “1” 与 “*” 
操作 符 之 间 缺 少 空格 。 当 它们 紧 贴 在 一 起 时 被 编译 器 理解 成 注释 的 开始 部 分 ， 并 把 它 与 下 一 - 
个 “#4” 之 则 的 所 有 代码 者 变 成 注释 的 内 容 。 

跟 错 误 地 编写 了 一 个 注释 符号 相关 的 情况 是 ， 打 算 结 束 注释 时 却 由 寺 意 外 末 能 结束 。 有 

-种 ANSI C 编译 器 的 某 个 发 行 版 本 有 一 个 有 趣 的 Bug。 符 号 表 i 一 个 散 列 函数 访问 ， 该 函 
数 计 算 一 个 进行 一 系列 搜索 的 大 敏 起 始 位 置 。 计 算 过 程 用 注释 的 形式 在 代码 中 出 现 ， 注 释 内 
容 非 常 详尽 ， 甚 至 提 到 了 提供 算法 的 书 。 不 幸 的 是 ， 该 程序 员 忘 了 结束 注释 ， 导 致 整个 散 列 
初始 值 计 算 过 程 也 成 了 注释 的 一 部 分 , 结果 就 成 了 下 面 的 代码 。 你 应 该 与 上 能 发 岗 问 题 所 在 ， 
并 知道 这 样 会 发 生 什 么 。 

int hashval = 0; 

yx PW hash function from "Comp:ilers: Principles, Techniques, and Tool1s， 

* by Aho, Sethi, and Ullman, Second Edition, 
while{cp < bound) 


{ 
unsigned long Overft lowy 





hashval = (hashval < 4) + *cCp++; 
if{{overflow = hashral & ({((unsigned long) OxF} << 28}} 5= 0) 
hashval ^= overflow | {overflow >»>>24); 
} 
hashval %= ST_HASHS--ZE) /xx 选择 起 始 桶 *7 
/* 搜索 每 个 表 ， 这 次 搜索 名 字 ， 如 果 失 败 ， 保 存 该 字符 串 ， 
* 进 入 字符 串 的 指针 ， 热 后 返回 它 ， 
x7 
fcr (hp = &st_ihash; ;hp = hp->st_ hnext) { 
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irt probeval = hashval; A* 下 一 个 探测 值 *;/ 
初始 散 列 值 的 整个 计算 过 程 被 省 栈 掉 了 ， 这 样 当 程序 对 符号 表 进 行 搜 索 时 ， 每 次 总 是 
第 零 个 元 素 开 始 进行 ! 结果 符 妨 表 搜索 《 编 详 器 中 极为 常见 的 操作 》 比 它 预 期 的 要 慢 得 多 
这 个 问题 在 测试 过程 中 认 术 被 发 现 过 ， 内 为 它 只 影响 和 搜索 的 迹 度 而 人 影响 结果 。 这 就 是 有 些 
编 详 器 在 注释 宁 符 中 中 间 发 现 “/x#” 会 发 出 警告 信息 的 原 内 。 这 个 错误 最 终 在 导 找 男 -个 Bug 
的 过 程 中 被 发 现 ， 在 适 六 位 置 揪 入 “着 ”后 ， 立 刻 使 编 详 速度 提高 了 15%! 


2.4.3 C++ 的 另 一 种 注释 形式 


C++ 并 未 对 C 的 绝 人 人 多数 缺陷 予以 修正 ， 但 它 还 是 采用 了 -种 方法 米 避 免 这 种 容易 发 和 
意外 的 注释 形式 。 和 BCPL 一 样 ，C++ 引 入 了 7 注释 符 ， 把 该 符号 以 后 由 至 行 末 的 内 容 均 作 为 
注释 内 容 。 

人 们 最 初 以 为 “1H” 注释 符 不 会 改变 任何 语法 正确 的 C 代码 。 今 人 莫 记 的 是 ， 事 作 并 非 
如 此 。 

有 YX 二 

A 

上 而 的 代码 , 在 C 语言 中 表示 afb, 供 在 C++ 语言 中 表示 a。C 风格 的 注释 在 C++ 语言 中 
依然 有 效 。 


2.4.4 ”编译 器 日 期 被 破坏 


在 C 语 言 中 ， 很 容易 写 出 一 些 能 够 轻松 通过 编 详 ， 但 在 运行 时 却 产 生 ，- 堆 垃圾 的 代码 。 
木 行 所 描述 的 Bug 就 是 一 个 非常 好 的 例子 。 在 任何 语言 中 ， 都 可 能 出 现 这 样 情况 (比如 除数 
为 零 )， 但 很 少 有 语言 能 像 C 语音 那样 提供 如 此 丰富 而 意外 的 机 会 ， 

Sun 的 Pascal 编 详 器 最 近 进 行 了 “国际 化 ” 也 就 是 说 进行 了 改进 ， 使 之 能 够 〈 改 进 的 成 
果 之 一 ) 按照 当地 的 日 期 格式 在 源 代码 列表 中 打印 日期 。 比 如 在 法 国 ， 日 期 可 能 以 Lundi 6 
Avril 1992 这 样 的 形式 出 现 。 其 工作 过 程 如 下 ， 编 译 器 首先 调用 stat() 得 到 UNHX 格式 的 源 文 
件 修正 时 间 ， 然 后 调用 localtime() 将 其 转换 为 tm 结构 ， 最 后 调用 stftime0 了 负数， 把 tm 结构 
转换 为 以 当地 日 期 格式 表示 的 ASCII 字符 串 。 

令 人 不 快 的 是 ， 这 里 存在 一 个 Bug， 症 状 就 是 表示 日 期 的 字符 串 被 破坏 。 按 照 预 想 ， 打 
印 出 的 日 期 应 该 如 下 : 

lundi 6 Avril 1992 

但 结果 却 成 了 这 么 一 种 损坏 了 的 形式 ;: 

LuUirTg’ Y Sxxdj] @ “F 

这 个 函数 仅 有 四 条 语 包 ， 而 且 存 所 有 情况 下 传递 给 消 数 的 参数 都 是 止 确 的 。 下 几 是 源 代 
亿 ， 看 看 你 能 不 能 找 出 字符 串 破 坏 的 问题 所 在 。 
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/* 将 源 文 件 的 times-amp 转换 为 表示 当地 格式 日 期 的 字符 串 */ 


char * Jocalled timelchar * fjlename) 
t 

struct tm *tm pir: 

struct star stat_block: 

char buffer[120]; 


i* 获得 源 文件 的 -imestiamp， 格 式 为 t-me_t */ 


stallrilename, &stat_ plock): 


/* 把 UNIX 的 time_t 转换 为 tm 结构 ， 里面 保存 当地 时 间 */ 


tm pir = Localtimel Star block,.st_mtime}: 


/1* 把 tm 结构 转换 成 以 当地 日 期 格式 表示 的 字符 捉 */ 


strttimelbutier, sizeof (butffer), "%a ®%b $e %®T $Y", tr_ptr}; 


retw“n buffer:; 
} 


看 出 来 了 吗 ? 时 间 到 ! 问题 就 出 现在 函数 的 最 后 - 行 ， 也 就 是 返回 buffer 的 奢 行 。puffer 
是 一 个 日 动 分 配 内 存 的 数组 , 是 该 函数 的 局 部 变量 。 当 控制 流 岗 并 声明 月 动 变量 ( 即 局 部 变量 ) 
的 范围 时 , 白 动 变量 使 腿 动 失效 。 这 就 意味 着 即使 返回 个 指向 局 表 变 基 的 指针 ( 比如 此 例 )， 
当 函 数 结束 时 ， 由 于 该 变量 已 被 销毁 ， 谁 也 不 知道 这 个 指针 所 指向 的 地 址 的 内 容 是 什么 。 

在 C 诸 言 中 ， 日 动 变量 在 堆栈 中 分 配 内 存 。 第 6 章 会 详细 讲述 这 方面 的 内 容 。 当 包含 外 
动 变量 的 贸 数 或 代码 块 退出 时 ， 它 们 所 占用 的 内 存 便 被 回收 ， 它 们 的 内 容 肯 完 会 被 下 -一 个 所 
调用 的 函数 斤 荔 。 这 切取 决 于 堆栈 中 先前 的 自动 变量 位 于 何 处 ,活动 丽 数 声明 了 什么 灾 量 ， 
3 入 了 什么 内 容 等 。 原 先 自动 变量 地 址 的 内 容 可 能 被 立即 覆盖 ， 也 可 能 稍 后 才 被 履 盖 ， 这 就 
起 日 期 破坏 问题 难以 被 发 珊 的 原因 。 

解决 这 个 问题 有 几 种 方案 。 

1. 返回 一 个 指向 字符 串 常量 的 指针 。 例 如 ， 

char * funct) { ret'urn *Only werks for simple strings"”; } 

i* 只 适用 于 简单 的 字符 囊 */ 

这 是 最 简单 的 解决 方案 ， 但 如 果 你 需要 计算 字符 串 的 内 容 ， 它 就 无 能 为 力 了 ， 在 本 例 中 
就 是 如 此 。 如 果 字 符 串 常量 存储 于 只 读 内 存 区 但 以 后 需要 改写 它 时 ， 你 也 会 有 麻烦 。 

2. 使 用 全 局 声明 的 数组 。 例 如 ; 


char *funt) { 
my_global array[i. = 


return my_golbal_array; 
} 
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这 适用 于 站 已 创建 字符 出 的 情况 ， 也 很 简单 易 用 。 它 的 缺点 在 于 任何 人 都 在 可 能 在 任何 
时 候 修 改 这 个 企 局 数组 ， 丰 县 该 函数 的 卜 -次 调用 也 会 覆盖 该 数组 的 丹 容 。 

3. 使 用 静态 数组 。 例 如 : 

Char Euricty) 过 

slatlic cnar buffari?70]; 

Ee 

} 

这 就 可 以 防止 任何 人 修改 这 个 数组 ， 只 有 拥有 指向 该 数组 的 指针 的 出 数 〈 通 过 参数 传递 
给 它 ) 才能 修改 这 个 静态 煞 组 。 但 是 ， 该 明 数 的 下 一 次 调 峰 将 覆 羡 这 个 数组 的 内 容 ， 所 以 调 
用 者 必须 在 此 之 前 使 用 或 备份 数组 的 内 容 。 和 全 局 数组 一 样 ， 大 型 缕 冲 区 如 果 闲 置 个 用 是 非 
党 浪费 内 存 空间 的 。 

4. 显 式 分 配 一 些 内 存 ， 保 存 返回 的 值 ， 例如 


char * tncft) { 
char * S = mallos(120}; 


return Ss? 

} 

这 个 方法 具有 药 态 数组 的 优点 ， 而 且 在 每 次 调用 时 部 创建 一 个 新 的 缓冲 区 ， 所 以 该 限 数 
以 后 的 调 册 不 会 箱 盖 以 前 的 返回 值 。 它 适用 于 多 线 程 的 代 妈 (在 某 一 时 刻 有 具有 超过 一 个 的 活 
2 理 的 责任 。 根 据 程序 的 复杂 程度 ， 这 项 
任务 可 能 很 容易 ， 也 吕 能 很 复杂 。 如 果 内 存 尚 在 使 用 就 至 放 或 者 出 现 “ 内 人 存 泄漏 (不 再 使 用 
a 

5. 也 许 最 好 的 解决 方案 就 是 要 求 调用 者 分 配 内 在 米 保存 函数 的 返回 值 。 为 了 提高 安全 
性 ， 调 用 者 应 该 同时 指定 绥 济 区 的 大 小 (就 像 标准 库 中 fgets0 所 要 求 的 汗 样 )。 


void func( char * :esyult, int size} { 


strncpy {result, "That'’'d be in the data segment, Bob", size),; 
} 


buffer = mallocfsixce)， 

functbuffer, size). 

SD 

如 果 程 序 员 可 以 在 同 -- 代 码 块 中 同时 进行 “malloc” 和 “free” 把 作 ， 内 存 管理 总 最 为 轻 
松 的 。 这 个 解决 方案 就 可 以 实现 这 一 点 。 

为 了 人 避免 “日 期 破 十 ”问题 ， 注 意 lint 程序 会 对 下 面 这 样 最 简单 的 例 了 发 出 警告 


return local array; 
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管 告 信息 是 : function returns pointer to antomatic《 遇 数 返 回 “个 指向 月 动 变量 的 指针 )》， 


然而 ， 无论 是 编 详 器 述 是 lint 程序 部 无 法 检测 到 局 部 数组 返回 的 所 右 情 沈 ( 它 有 可 能 通过 此 
层 间接 形式 存在 衙 过 检 柱 )， 


2.4.5 lint 程序 绝 不 应 该 被 分 离 出 来 


人 多 程序 玫 回 小 着 -~ 个 主题 ，lint 程序 能 够 检测 人 旬 门 题 ， 并 装 
你 发 出 警 向 。 在 编码 时 必须 极为 小 心 训 弄 二 有 时 人 lint 程序 记 获 人 告 ， 如 果 lint 程序 的 芍 
守信 息 能 向 编 详 器 自动 产生 ， 那 就 吓 以 省 掉 很 多 晾 糯 。 

在 UNIX 上 早 其 的 C 洛 襄 ,语言 设计 者 作 击 了 一 个 明确 的 决定 ， 扎 编 详 器 中 所 有 的 语义 
失 否 措施 部 分 离 册 来。 错误 检查 由 一 个 单独 的 程序 完成 ， 这 个 程序 被 称 为 “Jint”。 人 在 乔 拓 了 
全 面 的 错误 检查 后 ， 编 详 器 可 以 做 得 更 小 、 更 快 而 且 更 简单 。 不 管 怎样 ， 编 译 器 对 十 程序 员 
的 所 作 所 为 帮 度 该 信任 ， 只 要 按照 他 的 指示 去 做 就 是 了 。 对 不 对? 错 ! 


Ver 02 0 aed Ne Nee LT NAN A aA NA er es ao, 


ee 


UE -ooscoocaosssesssy acicooooveee 


早 用 lint 程序 ， 勤 用 lint 程序 


]int 班 序 是 软件 的 道德 准则 。 当 你 做 错 事 时 ， 它 会 告诉 你 哪里 不 对 .应 该 始终 使 用 lint 
程序 ， 按 照 它 的 道德 准则 办 事 。 








TPIS AA ON a rere FIFANEN AARTe TA WA A RA waveaea 


把 lint 程序 从 编译 器 中 分 岗 出 来 作为 一 个 独立 的 程序 是 一 个 严 条 的 失误 ， 人 们 青 到 觅 看 
十 得 识 公 这 个 问题 确实， 把 lint 程序 分 离 出 来 以 后 ， 编 详 器 变 得 更 小 、 豚 村 也 更 为 专 --， 
但 是 , 它 所 付出 的 巨人 代价 是 ; 代码 中 悄悄 混 进 了 大 量 的 Bug 机 不 可 靠 的 编码 风格 。 许多 (也 
许 症 绝 人 多 数 ) 程序 员 缺 省 情况 卜 在 每 次 编译 时 并 不 使 用 lint 程序 。 让 充满 Bug 的 代 亿 快速 
通过 编译 实在 是 很 不 划算 。 现 在 ， 许 多 lint 程序 中 的 检查 措施 又 重新 出 现在 编译 器 中 。 

然而 ， 有 一 项 上 作 在 Tnt 程序 中 经 常 进行 ， 但 在 当前 绝 大 多 数 的 C 编译 器 中 并 不 进行 。 
这 蒜 足 检查 各 个 文件 中 寺 数 使 用 的 一 致 性 。 许 多 人 兴 为 这 是 编 详 器 的 缺陷 所 造成 的 ， 并 不 足 
让 lint 程序 独立 存在 的 理由 。 所 有 的 Ada 编译 器 都 能 够 进行 这 种 多 文件 间 的 一 致 性 检查 、 人 在 
C 编译 器 中 这 也 是 一 种 趋势 ， 或 许 它 最 终 能 名 成 为 C 诗 言 的 “项 正常 功能 








一 一 一 一 一 一 ~- 





SunOS 的 lint party 
SunOS 开发 小 组 有 理 生 为 拥有 的 lint_clean i 能 顺利 通过 lint 程序 的 检查 ) 操作 系统 内 核 
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而 感到 自豪 。 我 们 费 了 许多 心血 才 使 4X 内 核 通 过 Jint 程序 的 检查 而 未 出 现任 何 警 告 信息 ， 
而 且 继 续 保 持 着 这 方面 的 成 就 . 1991 年 ， 当 把 源 代 码 基础 (Source base ) 从 BSD UNIX 改 成 
SVR4 时 继承 了 一 个 新 内 疼 ， 我 们 不 知道 新 内 核 中 是 和 否 经 过 lint 程序 的 检查 .结果 、 我 们 决 
定 用 lint 程序 对 整个 SVR4 内 核 进行 仔细 的 检查 ， 

这 个 活动 持续 了 几 个 星期 ， 并 被 称 为 “lint party”， 它 的 成 果 是 12,000 条 独特 的 lint 程 
序 警 告 信息 ， 我 们 对 每 一 条 信息 都 认真 加 以 研究 ， 并 手工 修正 与 之 对 应 的 代码 问题 ， 最 后 ， 
大 约 对 750 个 源 文件 进行 了 修改 ,因此 这 个 任务 又 被 称 为 “the lint mergc from hcll ( 地 鸭 般 的 
jint 考验 )”. 绝 大 多 数 lint 程序 的 错误 信息 的 原因 只 是 需要 一 个 显 式 的 类 型 转 接 或 lint 注释 。 
但 在 整个 过 程 中 ， 我 们 还 是 发 现 了 几 个 真正 严重 的 Bug: 

实 大 的 类 型 在 了 骂 数 和 调用 之 间 发 生 了 转变 ， 

”一 个 期 望 接受 3 个 参数 的 光 数 实际 上 只 传说 给 它 一 个 参数 ， 该 函数 将 从 堆栈 中 再 抓 
两 个 参数 ， 找 出 这 个 Bug 解决 了 stream 子 系统 中 断断续续 的 数据 破坏 问题 ， 

， 变量 在 设置 ( 初 妇 化 或 赋值 ) 前 使 用 . 

用 lint 程序 彻 查 内 核 的 价值 不 仅仅 在 于 去 除 现存 的 Bug, 而且 能 防止 新 的 Bug 污染 source 
base。 我 们 现在 要 求 对 源 代码 的 所 有 修改 或 增加 必须 能 通过 lint 和 cstyle 程序 检查 , 这 样 就 能 
保持 内 核 的 lint-clean 状态 。 采 用 这 种 方法 ， 不 仅 去 除了 现存 的 Bug， 而 且 减 少 了 将 来 可 能 出 
现 的 Bug。 





ee rom I AAAdAMHIPAALAarsms re a EEN het 


有 些 程序 员 上 坚决 反对 将 lint 程序 重新 粘 合 介 编 译 内 中 ， 他 们 认为 这 会 使 编 详 器 的 述 度 灾 
慢 ， 并 用 会 产生 太 多 的 虚 ' 乱 和 警 千 。 不 老 的 是 ， 经 验 不 断 证 时， 把 lint 程序 作为 -- 个 独立 的 .L. 
具 通 常 意味 若 把 lint 程序 束 之 高 阅 。 

软件 的 经 济 规律 显示 ， 越 起 在 开发 周期 的 早期 发 现 Bug， 修 复 它 所 付出 的 代价 就 越 小 。 
所 以 让 lint 程序 (如果 是 编译 器 就 更 好 了 ) 到 代 调 试 器 执行 寻找 Bug 的 额外 上 作 是 一 签 很 合 
算 的 投资 。 但 通过 调试 器 尾 发 现 问 题 又 比 内 部 测试 小 组 发 现 辣 题 强 。 最 坏 的 结果 就 是 几 顺 客 
发 现 问 题 。 


2.5 轻松 一 下 一 一 有 些 特 性 确实 就 是 Bug 


如 果 不 讲 完 太宰 任务 加 软件 的 故事 ， 本 章 束 不 能 说 是 完整 的 。 这 个 Fortran Do 循环 的 故 
事 《〈 在 本 章 升 始 部 分 讲述 ， 就 是 Mercury 子 轨道 飞行 系统 出 现 的 问题 ) 被 频繁 地 与 Mariner 1 
任务 错误 地 联系 在 一 起 。 

巧合 的 是 ，Mariner ] 也 践 一 个 戏剧 性 的 软件 失败 有 关 ， 但 它 的 行为 大 不 相同 ， 而 月 跟 请 
诗 的 选 拌 也 党 无 关系 。Mariner 1 于 1962 第 7 月 发 射 ， 它 的 任务 是 将 一 个 探测 器 放 在 金星 上 。 
但 在 发 射 厂 儿 分 钟 ， 地 而 控制 中 心 就 不 得 不 将 它 排 般 ， 因 为 发 射 它 的 Atlas 火箭 开始 偏离 轨 
道 ， 
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经 过 儿 个 星期 的 分 析 ， 问 题 被 确定 出 现在 软件 小 ， 代 它 是 一 个 算法 上 的 抄写 错 谋 而 不 吓 
一 个 程序 Bug。 换 铝 话 说 ， 程 序 严格 按照 程序 员 的 设想 执行 ， 但 在 说 明 扩 上 ， 指 令 本 吴 却 存 
在 错误 ! 跟踪 程序 被 确定 为 操作 平滑 〈 平 均 ) 的 速度 。 在 数学 中 ， 和 在 变 量 符 号 工 徊 加 个 水 平 
的 “(bar)” 符 号 表示 求 平均 ， 在 提供 给 程序 员 的 手写 制导 方程 式 中 ， 这 个 “ ”与 不 小 心 被 
漏 掉 了 。 

那个 程序 员 正 确 地 按 恨 算法 编写 了 程序 , 并 使 用 了 从 雷达 指引 的 原始 速度 而 不 十 平 均 
速度 。 结 果 ， 程 序 觉察 到了 火箭 速度 的 微小 波动 ， 在 经 典 的 负 及 馈 循环 中 ， 它 试 网 调整 火 
箭 的 速度 , 但 在 这 个 过 程 中 却 出 现 了 真正 的 不 稳定 行为 . 这 个 有 人 缺陷 的 程序 曾 几 于 以 曾 的 
几 个 任务 中 ,但 这 个 程序 邯 是 第 一 次 执行 。 在 以 前 的 几 次 飞行 中 ， 火 箭 的 飞行 症 由 地 人 而 控 
制 的 , 但 在 这 .… 次 ,由 于 六 线 故 障 使 它 尤 法 接收 到 巨 线 电 指 令 ，, 因此 使 用 了 飞船 上 的 控制 
软件 。 

深刻 教训 : 即使 可 以 保证 你 的 编程 语言 100 铝 可靠 ,你 仍然 可 能 成 为 算法 中 灾难 性 Bug 
的 牺牲 品 ， 

长 期 以 来 ， 我 们 -一 自 感觉 工作 于 实时 控制 系统 的 程序 员 应 该 具有 首先 测试 操作 原型 的 特 
权 。 换 句 话 说， 如 果 你 的 代码 实现 了 飞船 的 生命 支持 系统 ， 孝 么 你 应 该 能 够 进入 太空 亲 和 白 调 
试 最 后 的 小 故障 。 这 显然 会 使 产品 的 质量 得 到 更 高 的 保障 。 表 2-3 显示 了 一 些 机 会 ， 


表 2-3 两 个 著名 的 太空 软件 失败 的 真相 















1961 年 夏天 无 ， 错 误 在 飞行 之 前 | Fortran 语言 中 的 缺 联 





Mercury | 把 “,” 误 写成 “.” 









1200 万 美元 的 火 第 
种 探测 器 被 毁 






1962 年 7 月 22 日 | Marine | 在 软件 说 明 书 上 存在 


个 错误 


在 说 明 忆 中 ， 把 “ 尺 ” 
谋 写 战 4 RN 





让 我 们 以 一 个 更 加 现代 的 太空 软件 的 不 幸 故 事 来 结束 本 章 , 听 上 去 几乎 让 人 怀疑 是 假 的 . 
每 个 《 船 任务 执行 前 ， 都 更 按 照 货物 清单 对 起 飞 前 需要 载 入 到 飞船 上 的 货物 进行 检查 ， 清单 
上 列 出 了 每 个 货物 的 重量 ， 这 对 计算 燃料 和 平衡 机 舱 非 常 重要 。 在 发 船 进行 处 女 飞 行 之 前 ， 
一 位 船坞 长 正在 核查 装 到 飞船 里 的 物品 。 他 核查 了 计算 机 系统 ， 然 后 看 了 看 清单 中 的 软件 条 
目 。 他 发 现 了 一 个 问题 ， 软 件 的 重量 是 零 ， 这 引起 了 一 阵 小 慌乱 一 一 无 论 如 全， 任何 东西 总 
归 有 份量 啊 ! 


”在 问题 解决 之 前 , 装运 处 和 计算 机 中 心 有 过 一 番 激 烈 的 争论 。 最 后 这 个 零 重 量 的 软件 (内 
存 中 的 位 模式 ) 被 允许 入 船 ! 当然 ， 任 何人 都 知道 从 相对 论 的 角度 讲 ， 信 息 也 是 有 质量 的 ， 
个 过 我 们 还 是 不 要 卖弄 学 门 ， 破 坏 这 个 有 趣 的 故事 吧 。 


第 2 章 这 不 是 Bug， 六 是 语言 特性 
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“这 首 歌 的 名 字 叫 做 ' 哈 道 克 的 眼睛 (Haddocks’Eyes) 。” 

“ 哦 ， 歌 的 名 字 是 这 样 ， 真 的 ? ”区 丽 丝 说 道 ， 想 表现 出 一 点 兴趣 。 

“不 ， 你 并 不 明白 ，” 骑 十 说道 ， 看 上 去 有 些 慢 怒 ，“ 这 是 人 们 对 它 的 名 字 的 称呼 ， 它 
真正 的 名 字 是 “很 老 很 车 的 男人 (The Aged Aged Man)” .>” 

“那么 我 是 不 是 该 说 ' 那 首 歌 是 这 样 称呼 的 ，? ” 艾 丽 丝 纠正 自己 的 说 法 ， 

“不 ， 不 是 这 样 ， 这 是 另外 一 码 事 ! 这 首 歌 被 称 作 “手段 和 方法 (Ways and Means) ， 
但 这 只 是 它 被 称 作 那 祥 而 忆 ， 你 明白 吗 ? ” 

“好 了 ， 那 么 这 首 歌 淹 底 是 什么 ? ” 艾 丽 丝 说 道 ， 此 时 她 已 经 被 完全 摘 糊 涂 了 。 

“我 正 要 说 到 它 ，” 霸 士 说 道 ，“ 这 首 歌 实际 上 是 ' 国 坐 门 边 (A-sitting On A Gate) ， 
调子 是 我 自己 创作 的 .” 

— Lewis Carrotl, Through the Looking Giass 


传说 ， 维 多 利 亚 女 下 对 《 艾 丽 丝 漫 游 奇 境 记 》 极 为 着 迷 ， 于 是 她 要 求 得 到 Lewis Carroll 
的 其 他 书籍 。 女王 并 不 知道 Lewis Carroll 是 牛津 大 学 数学 教授 Charles Dodgson 的 笔名 , 当 献 
兹 的 宫廷 侍 臣 们 为 她 献上 几 本 大 部 头 书 包括 The Condensation({Factoringjof Determinants ( 数 
学 名 著 } 后 ， 女 王 陛 卜 林 能 从 书 中 寻找 到 乐趣 。 这 个 故事 在 维多利亚 时 期 流传 很 广 ，Dodgson 
况 力 对 此 进行 否认 : 
我 起价 这 个 机 会 ， 面 时 我 所 能 接 解 的 公众 ， 对 这 个 串 春 的 故事 进行 驶 斥 。 许 多 媒体 都 盛 
情 这 个 故事 ， 说 我 将 几 本 书 蛙 献 给 了 章 贵 的 女王 陛下 。 这 个 纯 属 子 应 乌有 的 故事 已 经 被 重复 
了 术 多 次 。 我 想 我 应 该 只 上 比 一 次 地 郑重 声明 ， 这 个 故事 从 头 到 尾 都 是 假 的 ， 即 使 与 传说 相似 
的 情况 也 不 曾 发 生 过 ， 
-一 Charles Dodgson，Symbolic Logic, 鞠 一 旗 
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我 企 ， 从 他 过 度 敏 感 的 反应 来 看 ， 我 们 可 以 合理 地 推断 这 个 故事 在 历史 上 全 有 其 事 : 无 
论 如 何 ，Dodgson 如 想 学 握 C 语言 应 该 是 很 窒 易 的 ， 而 女 下 陛下 则 更 朵 难 - 些 。 我 把 本 党 9 
请 部 分 的 一 些 关 键 询 列 丁 表 中 ， 如 二 所 未: 


被 称 作 | 是 








歇 的 名 学 | “Haddocks'Eyes” “The Aged Aged Man” 
上 “Ways and Means” “A-silling On A Gate” 
ee Pm et 


确实 ，Dodgson 如 果 研 究 计 算 机 科学 表 定 能 成 为 个 中 高 手 ， 而 匡 他 肖 定 特别 控 长 村 编程 
滞 诗 中 的 类 型 模型 {type model)、 例如， 下 面 的 C 语 襄 声 明 ; 


typecef char * string; 
Strirg punchline = "Im a frayed knot',; 


按照 骑士 的 思维 方式 ， 他 会 这 样 进行 由 解 : 
被 称 







安 昌 的 类 型 
容量 “ma frayed knot” 





| punchline 


你 泵 不 是 觉得 他 的 自觉 非常 局 人 ? 好 了 ， 囊 实 .上 这 里 涉及 到 好 多 东西 ， 当 你 阅读 完 椒 意 
之 后 ， 一 切 部 会 变 得 明了 ， 


3.1 只 有 编译 器 才 会 喜欢 的 语法 


Kernighan 和 Ritchie 承认 ,“C 语言 声明 的 语法 有 时 公 带 来 兴 重 的 问题 ,”(K&R'， 第 . 
版 ， 第 122 页)。C 请 吉 声明 的 语法 对 于 纲 译 器 〈 或 编译 器 设计 者 ) 的 处 理 来 说 并 不 是 什么 大 
不 了 的 事 . 也 对 于 一 般 的 得 序 员 ， 它 却 会 成 为 障 但 。 诸 总 的 设计 背 也 丰 人 ， 他 们 也 会 犯错 误 。 
例如 ，Ada 的 诗 言 参考 于 类 在 最 后 的 附录 中 所 附 的 Ada 语法 手册 中 ， 有 有 - :处 存在 歧义 。 对 于 
编程 请 二 的 语法 来 说 ， 野 义 是 非常 总 讳 的 ， 因 为 它 使 编译 器 设计 音 的 上 作 严 重复 杂 化 . 但 C 
语言 声明 的 诸 法 确实 非常 吕 怕 ， 渗 透 于 整个 语言 使 用 的 方方面面 。 毫 不 装 张 地 说 ， 正 是 由 于 
在 纽 合 类 型 方面 的 笨 增 行为 ，C 语言 被 显著 且 毫 无 必要 地 复杂 化 了 。 

C 语言 的 声明 模型 之 洲 以 如 此 用 涩 ， 这 里 有 儿 个 原 臣 。 六 十 年 代 晚 期 ， 大 们 在 设计 CC 请 
言 的 这 部 分 内 容 时 ,“ 类 型 借 型 (gpe model)” 这 个 概念 对 于 当时 的 编程 语言 理论 而 言 尚 属 隔 
生 。BCPL 诸 言 《C 语言 的 明 先 ) 儿 乎 没有 类 型 ， 它 把 二 进 制 字 作 为 惟 … 的 数据 类 型 ， 所 以 C 
语言 先天 有 缺 .然后 出 现 了 - -种 C 语言 设计 哲学 ， 要 求 对 象 的 声明 形式 与 它 的 使 用 形式 尽 可 


The C Programming Language， -一 - 译 耕 江 
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能 相似 。 :个 int 类 型 的 指针 数 给 被 声明 为 int *p[f3]; 并 以 *p[ 这 样 的 大 达 臣 引用 或 使 用 指针 
所 指向 的 int 数据 ， 所 以 它 的 声明 形式 和 使 用 堪 式 赤 常 相似 。 这 种 做 法 的 好 处 症 各 种 不 问 操 
作 符 的 优先 级 在 “声明 ”和 “使 用 ”时 证 - 样 的 。 它 的 缺点 什 填 霸 作 符 的 优先 级 (有 15 级 或 
刚 多 ， 取 决 丁 你 怎么 算 } 让 CC 语言 Rd -个 设计 过 于 复杂 之 处 ， 程序 员 凯 要 记 住 特 
殊 交 规 旭 才能 挫 源 证 int *Df3] 僻 底 是 -个 int > 和 针 数 组 , 还 十 一 个 指向 int 数组 的 指针 。 

和 "此 b 庄 ， | 其 他 语言 并 没有 采取 






这 种 方法 而 且 ，“ TT 病人 当时 也 不 像 是 个 特别 好 的 主意. 
boo Ai al bh Wad 区 中? 内 ea 人 多 人 承认 


irit &p; 
它 至 少 能 提示 p 是 个 整 型 数 的 地 址 。 这 种 语法 现 已 被 C++ 采纳 ， 用 于 表示 参数 的 传 址 





a ANSIC i volatile 和 const 关键 宁 后 ， 情 i 了 于 这 上 关键 Ee a 
出 现在 声明 中 (而 不 是 使 用 中 ), 这 就 舍得 现今 声明 形式 和 使 用 形式 能 完全 对 得 本 分 的 例 了 越 
来 越 少 了 。 那 些 从 风格 上 看 像 是 声明 ， 但 却 没 有 标识 符 的 东西 《如 形式 参数 声 Wi 
转换 ) 看 上 去 显得 滑 稳 . 如果 想 要 把 什么 东西 的 类 出 强制 转换 为 指向 数组 的 指针 ， 就 不 得 不 
使 用 卜 贞 的 语句 来 表示 这 个 强制 类 型 转 摘 ， 

char 1*j)[20]; zx 了 是 一 个 指向 数组 的 指针 ， 数 组 内 有 20 个 char 元 素 。*/ 

j= (char (x*) [20]) malloc{(20); 

如 果 把 星 号 曲 边 看 上 去 明显 多 余 的 括号 拿 控 ， 代 码 会 变 成 非法 的 

涉及 指针 和 const 的 1 明 可 能 会 出 现 几 种 不 局 的 腑 序 ; 

const int * grape; 


int const * grape; 
In * const grape je’ly; 


企 最 后 一 种 情况 卜 ， 浇 针 古 只 读 的 ， 而 在 另外 两 种 情况 卜 ， 指 针 所 指向 的 对 象 是 只 读 的 ， 
“1 然 对 象 和 指针 有 nn 能 都 是 从 读 的 ， 下 面 两 种 声明 方法 都 能 做 到 这 一 点 : 


conetl int * const grape_jam; 
int const * const 9rape_Jjam; 


ANSIC 提 人 到 typedef 说 明 符 之 所 以 被 称 为 “存储 类 型 说 明 符 ” 只 是 为 了 语法 上 的 方便 而 
已 ， 它 也 不 否认 其 中 存在 … 些 另外 的 问题 。 即 使 是 经 验 丰 富 的 C 程序 员 也 都 觉得 这 里 肪 烦 多 
多 。 如 果 像 “ 指 向 数组 的 指针 ”这 样 概念 清晰 的 语法 ， 它 的 声明 形式 也 是 如 此 星 深 难 懂 ， 邦 
么 对 于 更 复杂 的 语法 形式 义 将 如 何 。 例 如 ， 你 明白 上 下面 的 声明 (到 自 telnet 程序 ) 的 确切 意 
忆 吗 ? 


char * congst +*(*#*next) 1{); 
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我 将 在 本章 的 后 面 把 这 个 声明 作为 实例 讨论 时 再 给 出 它 的 答案 。 多 生来， 程序 员 、 学 生 
0 种 更 好 的 记忆 方法 和 法 则 来 搞 清 楚 恐 仙 的 C 将 言 声明 的 语法 。 木 阁 
提供 了 一 种 方法 ， 它 采用 一 种 循序 浙 进 的 方式 来 解决 这 个 问题 。 用 它 操纵 儿 个 实例 后 ， 就 不 
会 再 被 C 请 言 的 声 昌 所 出 拓 了 ， 


3.2 声明 是 如 合 形 成 的 


让 我 们 先 米 看 ， 人 -全 能 组 全 -个 声明 的 单独 语法 成 份 共 中 一 个 
非常 0 的 核心 .简单 地 说 ， 点 明 器 就 是 杯 
训 符 以 及 与 组 合 在 一 起 的 任何 指针 、 5 、 数 组 下 标 等 ， 如 才 3-1 所 示 。 为 方便 起 见 ， 
我 人 ] 拖 初始 化 内 窗 (initializer) 也 放 到 里 面 ， 放 分 类 表示 。 





















表 3-1 C 语言 中 的 声明 器 (declarator) 
数量 C 诺言 中 的 名 字 C 语言 中 出 现 的 形式 
鹤 个 或 多 个 下 列 肛 从 之 一 ， 加 
* const volaule 
* volatile 
. 
* const 
* yolatile const 
人 有 具 只 有 一 个 | 直接 声明 器 标识 符 
或 ， 标识 符 [下 标 ] 
或 : 标识 符 (参数 ) 
或 : 【〈 户 贡 器 ) 
零 个 或 一 个 | 


-个 声明 由 表 3-2 所 示 物 各 个 部 分 组 成 《并非 所 有 的 组 合 形式 部 是 合法 的 ， 但 这 个 表 拭 
述 了 我 们 进一步 讨论 所 要 用 到 的 闻 汇 )。 声 明确 定 了 变量 的 基本 类 型 以 及 初始 值 如果 有 的 
话 )。 
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表 3-2 C 语言 中 的 声明 
数 其 C 沁 言 中 的 名 兴 C 洁 主 中 出 现 的 形式 
伴 少 个 类 型 说 明 符 三 | 类 型 说 明 符 Yoid char short int long signed 


《type-Specifier) unsigned tloat double 
结构 说 明 符 〔stmct-specifier》 


枚 茶 说 明 符 Lenum-specihier) 






{ 放下 所 有 组 合 嘟 合法 》 : 合 说 明和 罕 Cunion-specifier) 
存储 类 型 extern static register 
‘ storage-class) auto typedef 
类 型 限定 从 const volatile 


(type-qualifier) 

















有 月 具有 -个 声明 上 峰 睛 见 二 而 的 定义 
《deciarator ) 
零 个 或 多 少 更 洛 的 声明 品 ,志明 器 
个 


让 我 们 看 一 卡 如 果 你 使 用 这 些 部 件 来 构造 一 个 声明 ， 情 况 能 够 复杂 到 什么 程度 。 辣 时 要 
记 住 ， 企 合法 的 声明 中 存在 限制 条 件 。 你 不 可 以 像 下 面 那 样 做 : 

，” 函数 的 返回 值 不 能 是 “个 函数 ， 所 以 像 feo00 这 样 是 非法 的 。 

” 限 数 的 返回 值 不 能 是 一 个 数组 ， 所 以 像 foo01] 这 样 是 非法 的 。 

* 数 纪 里 而 不 能 有 二 数 ， 所 以 像 foo[]0 这 样 是 非法 的 。 

代 谊 下 面 这 样 则 是 合法 的 : 

，” 流 数 的 返 |o| 值 允许 是 一 个 隐 数 指针 ， 如 ;， int(* fun0)0; 

。 疯 数 的 巡回 值 允 许 是 一 个 指向 数组 的 指针 ， 如 ，int(* fooO)[] 

， 数组 里 面 允 许 有 后 数 指针 ， 如 int (* foo[)0 

， 数组 里 而 允许 有 其 他 数组 ， 所 以 你 经 常 能 看 到 int foolj[] 

在 处 理 组 合 类 型 之 前 ， 让 我 们 先 讨论 一 下 在 结构 (struct) 和 联合 (unionm) 中 怎样 对 变量 进行 
组 合 ， 删 新 一 下 自己 的 记忆 ， 同 时 回顾 : ~ 下 枚 举 (enum)， 

3.2.1 关于 结构 

结构 就 起 一 种 把 一 些 数据 项 组 台 在 一 起 的 数据 结构 。 其 他 编程 语言 把 它 称 为 记 当 
(record)。 结 构 的 语法 很 容易 记忆 : 在 C 语言 中 ， 进 行 纽 合 的 通常 方法 就 是 把 需要 组 合 的 东西 
放 在 花 括 号 里面 : { 内 容 .. }。 关键 字 stmct 放 在 左 花 括号 前 而 ， 以 便 编 译 器 能 够 从 程序 块 中 认 
出 它 : 
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struct { 内 容 ... ) 
结构 的 内 容 可 以 是 任何 其 他 数据 声明 ; 单个 数据 项 、 数 组 、 其 他 结构 、 指 针 等 。 我 们 避 
以 在 结构 的 定义 后 而 跟 “ 些 变量 和 名， 表示 这 些 变量 的 类 起 足 这 个 结构 。 例 如 ， 
srruct { 内 容 .. } Eiun, pomegranale, pear; 
另外 还 需要 注意 的 点 十， 可 以 在 stmuct 关键 字 所 面 如 一 个 可 选 的 “结构 标签 ”: 
struct fruit_tag { 内 容 ..、} plum, omegranate, pear; 
这 样 , 我们 就 可 以 在 将 来 的 声明 中 几 stmct fruit_tag 作为 struct { 内 容 .. } 的 简写 上 展 式 了 . 
因此 ， 结 构 的 通 共 形式 龙 : 
struct 结构 标签 {可 选 】{ 
类 型 ] 标识 符 1; 
类 型 2 标识 符 2; 
类 正和 标识 符 N; 
} 变量 定义 (可 选 ); 
所 以 ， 在 下 而 的 声明 中: 


struct date tagf Short dd, mm, yy; }my_birthday,xmas; 
Struct date_tag easter, groundhog_day; 


变量 my_birthday 、xmas 、easter 和 groundhog_day 属于 相同 的 数据 类 型 。 结 构 中 也 允许 
存在 位 段 、 盛 名 宁 段 以 及 宁 对 齐 所 需 的 填充 字段 。 这 些 部 是 通过 在 字 上 段 前 声明 后 面 加 一 -个 骨 
号 以 及 一 个 表示 字段 位 长 的 整数 来 实现 的 。 

/* 处 理 ID 信息 */ 


StrucL pid_tag { 
unsigned inL inactive : 1; 


unsigned int : 1; A* ] 个 位 的 填充 */ 
unsigned int reicount : 6; 
unsigned int : 0; 1* 填充 到 下 一 个 字 边 界 */ 


Short pid_id; 

struct pid tag "1ink; 
}; 
这 种 用 法 通常 被 称 作 “深入 逻辑 元 件 的 编程 ” 你 可 以 在 系统 编程 中 看 到 它们 。 它 也 能 用 
于 把 一 个 布尔 标志 以 位 而 不 是 字符 米 表示 .位 段 的 类 型 必须 是 int, unsigned int 或 signed int( 或 
加 上 限定 符 )。 人 至 于 int 位 段 的 值 可 不 可 以 取 负 值 则 取决 于 编译 器 。 

我 不 喜欢 把 结构 的 声明 和 变量 的 定义 混合 在 起。 我 更 喜欢 采用 |; 

SLIUCLt veg { jnt weight, price_per_lb; }; 

struct veg onion, radish, turnip; 
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而 不 是 : 
struct veg 7 rt waigkt, price_per_ib; } orion, radist, iurnip; 
Nae ab st A te an a 
是 否 容易 书写 ， 我 们 只 编写 一 次 代码 ， 介 在 以 后 的 程序 维护 过 程 中 将 光 次 疯 读 这 些 代 何 。 放 
宁 一 行 代 妈 只 做 一 件 事 ， 招 上 夫 会 更 简单 些 ， 人 
明 分 斤 。 
最 后 ， 还 有 两 个 跟 结 构 有 关 的 参数 传递 问题 。 有 些 C 语言 书籍 声称 “在 调用 消 数 时 ， 参 
数 按照 从 石 到 左 的 次 序 床 浏 枞 栈 里 ,” 这 种 说 法 过 于 简单 一 一 如 果 你 有 一 本 这 样 的 书 , 把 彤 
一 页 撕 下 烧 扣 。 划 果 你 有 一 个 这 样 的 编译 器 ， 把 该 编 详 器 源 代 人 码 的 上 儿 行 删 掉 。 参 数 在 传递 
时 首先 尽 亲 能 地 存放 到 寄 字 器 中 ee int 型 变 蛤 i 跟 具 包含 :个 int 型 成 员 
的 结构 当时 相 参 数 传递 过 的 方式 可 能 完全 -个 int 型 参数 - 般 会 被 传递 到 寄存 器 中 ， 
而 结构 参数 则 很 可 能 被 传阅 到 堆栈 中 。 第 二 ， A ee 半数 组 ， 如 ， 
人 # 数 锯 位 于 结构 内 部 */ 
SttrucL s_ tag © iat afl100]; }; 
现在 ， 你 可 以 把 数组 当 作 第 一 等 级 的 类 型 ， 用 赋值 语句 拷贝 整个 数组 ， 以 传 值 调 几 的 方 
式 拒 忆 传 递 到 也 数 ， 或 者 并 它 作为 瑞 数 的 返回 类 型 。 
struct s_tag { inz artl00]; }:} 
Struct s_tag orange, lime, lemori; 
Struct s_tag twofryldistruc, s_tag &) 1 
i - 直 
for(J- 0 j <: 100; j++) s.aii] *= 2; 
raturn s; 


} 
maizily { 
Lit :1 
fort{L 0; i < 100; l++r} lime.a[i] = 1; 


lemon twofoldlliame): 
Drange = jetcn; /* 给 整个 结 枸 赋 信 *,; 

} 

在 典型 情况 下 ， 并 不 会 闫 繁 地 对 整个 数组 进行 赋值 操作 。 但 总 如 果 需 要 这 样 散 ， 可 以 通 
过 殷 它 放 入 结构 中 米 实现 ， 让 我 们 在 本 小 节 的 最 后 ， 和 展示 在 结构 中 包含 一 个 指向 结构 本 身 的 
中 针 ， 这 种 方法 常用 于 列表 (isD、 树 (tree) 以 及 许多 其 他 动态 数据 结构 。 

/ 亲 结构 内 部 有 一 个 指 高 结构 自身 的 指针 */ 

strIuct rode_ tag{ int datlum:; 

Struct node_tag *"ext.: 
J 
struct node tag a, b: 
已 next = &b; 1* 日 用 链接 在 一 起 */ 
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C 专家 编程 


da.Tiext->rext - NUDL; 


3.2.2 关于 联合 


联合 (union) 让 许多 其 化 语言 中 被 称 作 变 体 记 水 (variant recordy)。 它 的 外 表 与 结构 相似 ， 但 
在 内 存 布 启 上 存在 关键 性 的 区 别 。 在 结构 中 ， 得 个 成 员 依 次 存储 ， 而 在 联合 中 ， 所 有 的 成 员 
部 从 向 移 地 址 零 于 始 存 人 入。 这样， 每 个 成 员 的 位 置 都 重 营 在 一起， 龙 某 一 上 时刻， 只 有 一个 成 
员 芮 正 存储 于 该 地 址 ， 

合 既 有 - 些 优点 ， 也 有 一 些 缺 点 。 它 的 缺点 就 是 郑 些 所 谓 的 优点 共 实 并 不 怎么 出 公 . 
联合 的 优点 是 它 的 外 观 同 结构 - 样 ， 只 是 用 关键 子 union 取代 了 关键 字 struct。 所 以 ， 如 果 你 
对 结构 的 -- 切 都 已 了 如 指 常 ， 基 本 上 也 就 掌握 了 联合 。 联 合 的 “ 般 形 式 如 下 : 

union 可 选 的 标签 1{ 
类 型 1 标识 符 1; 
类 型 2 标识 符 2; 
类 型 N 标识 符 N; 
1 可 选 的 变 景 定义; 
联合 一 般 是 作为 大 型 结构 的 一 部 分 存在 的 。 在 有 些 大 型 结构 中 ， 存 在 一 些 与 实 队 表示 的 
数据 类 型 有 关 的 隐 式 或 显 式 的 信息 。 如 果 存 储 数据 时 是 一 种 类 型 ， 但 在 提取 该 数据 时 却 成 了 
刀 外 一 种 类 型 ， 这 显然 存在 着 明显 的 类 型 不 安全 性 。 在 Ada 中 ， 所 有 不 同类 型 的 字段 孝 显 式 
地 存储 于 记录 中 ， 这 就 避免 了 这 个 问题 。C 诸 言 则 含糊 得 多 ， 让 程序 员 电 己 去 回忆 放 在 沙 几 
的 究竟 是 什么 东西 。 
联合 般 被 用 来 节省 空间 ， 因 为 有 些 数 据 项 是 不 是 能 同时 出 现 的 ， 加 果 辣 时 存储 它们 ， 
显然 磊 为 浪费 。 例 如 ， 如 果 我 们 要 存储 一 些 关 于 动物 种 类 的 信息 ， 首 先 想 他 的 方法 可 能 是 ; 
Struct creaturef 
char haas,_backbone; 
char has_fur; 


short num of_legs, in_excess_of 4; 
}; 

但 是 ， 我 们 知道 ， 所 在 的 动物 要 么 是 兰 椎 动物 ， 贤 么 是 无 痊 礁 动物。 进而， 我 们 还 知道 
只 有 和 疹 椎 动物 才 可 能 有 毛皮 ， 只 有 无 消 椎 动物 才 可 能 有 多 十 4 条 的 腿 。 没 有 一 -种 动物 既 有 毛 
皮 又 有 超过 4 条 的 腿 。 这 样 ,可 以 道 过 把 两 个 相 筷 排斥 的 字段 存储 十 一 个 联合 中 米 节 省 空间 ， 

union secondary.characteristicest 

char has_fur; 

Short num of_legs_:i.n_excess_of_4; 

J 

struct créeature 1{ 

char has_backbone; 

Union secondary_characteristics form: 
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}; 

我 们 通常 来 取 这 种 方式 来 节省 备用 的 在 储 衬 间 。 如 果 我 们 有 -个 数据 文件 ， 贞 面 存 娃 了 
20000000 个 动物 ， 使 用 这 种 方法 ， 可 以 节省 人 约 20MB 的 磁盘 字 间 。 

然而 ， 联 会 还 有 其 他 用途 :联合 也 可 以 把 同 -- 个 数据 解释 成 丙种 相同 的 东西 ， 而 不 是 把 
网 个 不 同 的 数据 解释 为 问 一 种 东西 。 非常 有 意思 的 是 , 这 种 功能 跟 COBOL 中 的 REDEFINES 
子 句 -~ 模 - 样 。 该 用 法 例 书 如下: 


nion Pils32_tagt 


inc whole; #2* -个 32 位 的 值 *7 
struct { char 5D, cl, c2, cca; } byre; ji 有 个 8 从 的 字 革 *j 


} value; 

这 个 联合 允许 程序 员 提 了 到 整个 32 位 值 (作为 intY)， 也 可 以 提取 单独 的 学 节 华 段 如 
value.byte.c0 等 。 杀 用 其 代 . 的 方法 也 能 达到 这 个 昌 的 ， 伺 联合 不 测 要 额外 的 赋值 或 燥 制 类 弄 
转换 。 为 了 找 乐 , 我 但 看 了 150000 行 与 机 器 无 关 的 操作 系统 源 代 玛 。 结 类 显示， 结构 出 现 的 
次 数 大 约 是 联合 的 一 白 倍 。 这 上 果 以 提醒 你 ， 在 实际 工作 中 ， 你 过 见 结构 的 次 数 将 光 远 多 十 联 


人 O 
tlio 


3.2.3 ”关于 枚 举 


枚 举 (enum) 通 过 一 种 简单 的 途径 ， 把 一 申 名 字 与 - 申 整 型 值 联系 在 一 起 。 对 十 像 这样 
的 弱 天 型 语音 而 言 ， 很 少 有 什么 事 只 能 靠 枚 举 来 完成 而 川 #define 不 能 解决 的 .所 以 ， 作 大 多 
数 早期 的 K&R C 编 详 器 中 ， 部 省 掉 了 枚 举 。 但 是 枚 举 相 其 他 人 多 数 语言 中 都 存在， 所 以 C 
说 言 最 终 也 实现 了 它 。 现 在 ， 对 于 枚 举 的 一 般 形 式 ， 你 谱 当 已 经 相当 熟悉 了 了; 

enum 可 选 标签 { 内 容 ..} 可 选 变量 定义 ; 

其 中 的 “ 汶 容 ”是 -- 些 标识 符 的 列表 ， 订 能 有 一些 整 型 值 赋 给 它们 。 下 而 是 -个 枚 举 
实例 ; 

enum 812es { sma-l = 7, medium, large = 10，hurangcus }; 

缺 省 情况 下 ， 整 型 值 从 到 开始 。 如 果 对 列表 中 的 某 个 标识 符 进行 了 赋值 ， 那 么 紧 接 其 后 
的 那个 标识 符 的 值 就 比 所 冉 的 值 大 1， 然 后 类 推 。 校 举 上 共有 一 个 优点 ，#define 定义 的 名 字 
般 企 编 译 时 被 于 弃 ， 而 枚 准 名 字 则 通常 ~ 直 在 调试 器 中 可 见 ， 可 以 在 调试 代码 时 使 用 它们 。 


3.3 优先 级 规则 


到 现在 为 止 ， 我 们 已 经 回 腊 了 声明 的 各 个 组 成 部 分 。 本 节 描 述 了 一 种 方法 ， 用 通俗 的 语 
司 把 启明 分 解 开 来 ， 分 别 解释 各 个 组 成 部 分 。 要 理解 一 个 声明 ， 必 须要 懂得 其 小 的 优先 级 规 
则 ,语言 律 师 们 最 喜欢 这 种 形式 ， 它 高 度 简洁 ， 可 惜 极 不 直观 。 
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理解 C 语言 声明 的 优先 级 规则 


A ”声明 从 它 的 名 字 开 始 读 取 ， 然 后 按照 优先 级 顺序 依次 读 取 . 
B ”优先 级 从 高 到 低 依次 是 : 
B. 1 上 声明 中 波 括 号 括 起 来 的 那 部 分 
B. 2 ， 后缀 操作 符 : 
括号 (表示 这 是 一 个 通 数 、 而 
方 括号 [] 表 示 这 是 一 个 数组 。 
B，3 前 缓 操作 符 : 星 号 * 表 示 “ 指 向 ... 的 指针 "” 
C 如果 const 和 1 或 ) volatile 关键 字 的 后 面 紧 跟 类 型 说 明 符 【如 int long 等 ) ， 那 么 
它 作 用 地 类 型 说 明 符 ， 在 其 他 情况 下 ，const 和 (或 ) volatile 关键 字 作 用 于 它 左边 
a 


用 优先 级 规则 分 析 C 诸 志 声明 一 例 ; 


char * constl * (insxL)()} 


表 3-3 用 优先 级 规则 解决 一 个 声明 





适用 规则 解释 

A 闻 先 ， 看 变量 名 “next*， 并 注意 到 它 直 接 被 括号 所 括 佬 
Bl | 所 以 先 把 括 芳 里 的 东西 作为 “个 整体 ， 得 出 “next 是 个 指向 .的 指引 ” 

B | 然后 兰 庶 括 号 外 面 的 东西 ， 在 里 号 前 统 和 括号 后 绥 之 癌 作出 选择 


B.2 B.2 规则 告诉 我 们 优先 级 较 高 的 足 右 边 的 函数 括 另 ， 廊 以 得 出 “next 是 个 
刺 数 指针 ， 指 向 一 个 返回 ... 的 两 数 ” 
B.3 然 乒 ， 处 上 凤 前 缘 “*”， 得 出 指针 所 指 的 由 容 





把 上 述 分 析 结 果 加 以 概括 ， 这 个 声明 表示 “next 是 个 指针 ， 它 指向 一 个 函数 ， 该 滑 数 
返 问 为 一 个 指针 ， 该 指针 择 向 “个 类 型 为 char 的 常量 指 外 ”大功告成 。 优 先 级 规则 浓缩 了 
所 有 的 规则 ， 如 宁 你 更 喜欢 看 上 去 直观 一 些 的 方法 ， 请 看 网 3-1 。 
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步骤 号 匹配 的 符号 如 何 阅 讯 
. 取 最 左边 的 标识 符 表示 “标识 符 是 ” 


一 








对 十 每 对， 表示 





2 查看 标识 符 右边 的 F 个 ee 
符号 ， 如 打 是 方 条 所 “的 数组 ” 
i so i 好 -应 bk 
3、 旭 果 是 一 个 左 括 与 (可 能 的 参数 ) 于 右 括 号 为 止 的 内 容 
赤 示 “返回 .的 函数 " 
1 J 六 个 去 二 已 扣 站 绍 睹 惠 
是 一 个 左 括 切 的 部 分 声明 组 合 在 一起， 
直到 遇见 对 应 的 布 括号 ， 
热 后 从 第 2 步 重 新 开始 。 
5， 如 果 左 边 的 符 
const 
号 蚌 下 述 之 一 : 
Const 继续 则 左边 读 符 导 ， 直 到 所 读 
volatile . 符 二 不 再 是 左边 那 3 个 之 一 。 
volatile 
记 果 符号 是 const 表 示 “ 只 读 ” 
如 果 足 volatile, 衣 小 “Yolatile” 
如 果 是 *， 表 示 “ 指 向 .的 指针 ” 
然后 重复 第 4 步 。 
6. 剩余 的 符 寻 可 一 其 阅读 ， 如 


剩 下 的 符号 形成 此 本 类 型 
声明 的 基本 类 型 


图 3-1 如 何 解析 C 语言 的 声明 


static unsigned int 


C 语 兰 声 明 的 神奇 解码 环 
C 语 关中 的 声明 读 起 来 并 没有 固定 的 方向 ， 一 会 儿 从 左 读 到 让 ， 一 会 儿 又 从 右 读 到 左 ， 真 不 知 该 用 一 个 怎样 的 词 来 措 壕 这 个 
情况 。… 开 始 ， 我 们 从 左边 开始 疝 在 寻找， 直到 找到 第 一 个 标识 符 。 当 声明 中 的 其 个 符 导 与 图 中 斥 示 匹配 时 ， 便 把 它 从 声 时 中 处 
理 掉 ， 以 后 不 再 考虑 。 在 具体 的 每 一 步 紧 上 ， 我 们 首先 查看 右边 的 符号 ， 热 睫 再 看 左边 。 
当 所 有 的 符号 都 被 处 理 完毕 后 ， 便 宜 告 大 功 告 成 。 


3.4 通过 图 表 分 析 C 语言 的 声明 


本 节 我 们 展示 一 张 里 面 标明 了 分 析 步 又 的 图 ( 见 网 3.3)， 如 果 你 按 图 索 疤 ， 从 第 -- 步 开 
始 ， 顺 考 稍 头 逐 步 往 下 分 析 ， 无 论 多 么 复杂 的 咏 语言 声 明 都 可 以 迎 刀 而 解 ， 都 可 以 用 最 通 从 
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的 语言 米 解 释 ( 无 论 你 希望 简单 易 履 到 行 么 程度 )。 在 图 中 忽略 了 typedef 以 简化 声明 。 如 果 
志明 中 有 typedef， 总 把 它 峙 译 成 没有 typedef 的 样子 。 如 果 它 类 似 于 “typedefp a ...” 这 种 形 
式 ， 就 把 声明 中 所 有 类 型 为 “a .,.” 的 东西 用 “p” 来 代替 . 

让 我 们 试 - - 些 例子 ， 睹 图 中 所 示 方 法 来 分 析 声 明 。 和 假如 我 们 想 知道 本章 开头 所 举 的 部 个 
代码 例子 的 意思 


char * const *({*next) (): 


在 分 析 这 个 声明 时 ， 需 上 竖 逐 渐 把 已 经 处 理 过 的 片段 ”去 折 ” 这 样 便 能 知道 还 南 改 分 析 多 
少 内 容 。 再 次 提醒 ， 记 信 const 表示 “只 读 ”， 并 不 能 因为 它 的 意思 是 常量 就 认为 它 表 示 的 就 


.5/4 
A Mo 


处 理 过 程 显示 人 香农 3-4 中 ， 在 每 -步骤 挂 ， 所 处 理 的 那 部 分 店 明 用 黑体 表示 。 从 第 : 步 
开始 ， 我 们 将 依次 进行 这 些 步 又 ， 


表 3-4 分 析 一 个 © 语言 声明 的 步 又 











剩余 的 鼎 明 
“从 最 左边 的 标识 符 开始 ) 


char * const *(*next) { ); 






所 水 取 的 下 -- 步 又 


表示 “next 是 .，” 
不 匹配 ， 园 到 下 - 步 ， 表 示 “next 二 7” 

不 嘴 配 ， 转 到 下 - - 步 

与 星 和 匹配， 表示 “指向 … 的 指针 ”， 转 第 4 步 









char * Const *(* 
char * const *(* ye 


char * Const *(* (0); 








char * const *{ } O00); “(和 ”区 本， 转 到 第 2 步 
char * const * (); 不 也 配 ， 转 到 卜 ，- 步 。 

char * const +* (); 第 3 步 表示 “返回 .的 疝 数 ” 

char # const * | 第 4 步 匹配 ， 转 到 下 一 步 

char * const * . 第 $ 步 去 未 “指向 … 的 指针 ? 

char * const ; 第 5 步 表示 “ 肉 读 的 ,.,” 

char * ; 表示 “ 指 癌 .的 的 指针 ” 

char 表示 “char” 


拼 在 一 起 ， 读 作 : 

“next 是 一 个 指向 畏 数 的 指针 , 该 函数 返回 另 一 个 指针 , 该 指针 指向 一 个 只 读 的 指向 char 
的 指针 ” 大 功 告 成 。 

现在 让 我 们 试 一 个 更 复 涩 的 例子 。 

char *(* cc[10]}) (in: **p); 

请 按照 上 面 那个 例子 的 步骤 进行 分 析 。 具体 步骤 在 本 章 的 最 后 给 出 , 可 以 白 己 先 试 一 下 ， 
然后 对 照 一 下 答案 。 
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3.5 typedef 可 以 成 为 你 的 朋友 


typedef 旦 一 种 有 趣 的 虞 明 形 式 ， 它 为 一 -种 类 型 中 入 新 的 名 字 ， 疝 不 是 为 变 昌 分 配 罕 则 ， 
在 其 些 方面 ，typedef 类 亿 于 宏文 本 替换 一 一 它 并 没有 3 引入 新 类 型 ， 而 是 为 现 有 类 型 凡 个 新 名 
字 ， 但 它们 之 问 存 在 一 个 关键 性 的 区 则 ， 容 我 稍 后 解 称 , 

由 果 现 在 回 过 法 去 看 看 “声明 是 如 何 形 成 的 ” 那 … 季 ,会 发 现 typedef 关键 字 可 以 是 “个 
常规 声明 的 一 部 分 ， 可 以 出 现在 靠近 声明 开始 部 分 的 任何 地 方 。 事 实 上 ，typedef 的 格式 与 变 
量 声 时 完全 一 样 ， 只 是 多 了 这 个 关键 字 ， 向 你 提醒 它 的 实质 。 

出 于 typedef 看 上 去 良 变 星 声明 完全 一 样 , 它们 读 起 来 也 起 一 样 的 前 击 一 节 描 述 的 分 析 
技 与 也 同样 适用 于 typedef。 普 道 的 声明 表示 “这 个 名 子 是 一 个 指定 类 蜡 的 变量 ” 而 typedef 
大 键 子 并 不 创建 个 变量 ， 是 宣称 “这 个 名 字 是 指定 类 型 的 同义词 ”。 

一 般 情况 下 ，typedet 用 于 简洁 地 表示 指向 其 他 东西 的 指针 。 典 型 的 例子 是 signal0) 诛 型 
的 卢 明 。signalO 是 一 种 系统 调用 ， 用 于 道 知 运行 时 系统 ， 当 某 种 特定 的 “软件 由 断 ” 发 牛 时 
调用 特定 的 程序 。 它 的 真正 名 称 应 该 是 “Call_that_routine_when_this_interrupt_ comes_in 《 当 
该 中 央 发 生 时 调用 堵 个 程序 〉”。 你 调用 signal0)， 并 通过 参数 传递 告诉 它 中 断 的 类 型 以 及 用 于 
处 理 中 断 的 程序 .在 ANSIC 标准 中 ，signalO 的 声 时 如 下 : 

vciG (*signallint sig, void{*furnc) (int}))) {fint}; 

让 我 们 运用 刚刚 掌握 的 技巧 米 分 析 这 个 声明 ， 会 发 现 它 的 意思 如 下 : 

veidi*signalt }} tint}; 

signal 是 一 个 阴 数 (县 有 一 些 令 人 胆 战 心 家 的 参数 )， 它 返回 一 个 函数 指针 ， 后 者 所 指向 
的 函数 接受 一 个 int 参数 并 返回 void。 其 中 - -个 恐怖 的 参数 是 其 木 身 ， 

voidl*func) (int}); 

它 农 示 一 个 函数 指针 ， 所 指向 的 函数 接受 一 个 int 参数 ， 返 回 值 是 void。 项 在 ， 让 我 们 
看 一 下 怎样 用 typedef 来 “代表 ”通用 部 分 ， 从 而 进行 简化 。 

typedef void{*pti_to_func} (nt) ， 

/x* 它 表 示 ptr_to_func 是 一 个 函数 指针 ， 该 函数 

* ”接受 一 个 jnt 参数 ， 返 回 值 为 void. 
Wa 

ptr_to_func signal lint, ptr_to_func); 

/* 它 表示 signal 是 一 个 函数 ， 它 接受 两 个 浴 数 ， 

* ”其 中 一 个 是 jnt， 田 一 个 是 ptr_to_func， 返 回 


* 和 什 是 ptr_to_fuac, 


然而 ， 说 到 typedef 就 不 能 不 说 一 下 它 的 缺点 。 它 同样 共有 与 其 他 志明- 样 的 混乱 语法 ， 
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同样 可 以 把 儿 个 声明 路 塞 到 一 个 声明 中 去 。 六 二 结构 ， 除 了 可 以 企 蔬 写 寺 省 掉 struct 关键 字 
之 外 ,typedef 并 不 能 提供 显著 的 好 处 , 而 少 写 一 个 stmct 其 实 并 没有 多 大 帮助 . 在 任何 typedef 
声明 中 ， 甚 至 不 必 把 typedef 放 在 声明 的 开始 位 兽 。 





不 要 在 一 个 typedef 中 区 入 凡 个 声明 器 ， 如 下 所 示 : 


typedoef int tptr, (fun}y(})}, arr[l5]; 

ji* ptr 是 “指向 int 的 指针 ”类 型 ， 

* ”fun 是 “指向 返回 值 为 int 的 函数 的 指针 ”类 型 

* drr 是 “上 长 度 为 5 蕉 int 型 数组 ”类 型 

* 

干 万 不 要 把 typedef 谈 到 声明 的 中 间 部 分 ， 如 下 所 示 ， 


unsigned const long typedef int wolatile *kumcuat， 
rr 





typedef 为 数据 类 型 创 乍 别名 ， 而 不 是 创建 新 的 数据 类 型 ， 可 以 对 任何 类 型 进行 typedef 
声明 ， 

typedef int {*array_ptr) [100]; 

应 该 只 对 所 希望 的 变量 类 型 进行 typedef 声明 ， 为 变量 类 型 取 - -个 喜欢 的 别名 。 关 键 字 
typedef 应 该 如 前 所 述 出 现在 声明 的 开始 位 置 。 在 同一 个 代码 块 中 , typedef 引入 的 名 字 不 能 与 
其 他 标识 符 同名 。 


3.6 typedef int xf10] 和 jdqefine x intf10] 的 区 别 


前 而 已 经 提 到 过 , 在 typzdef 和 宏文 本 蔡 换 之 问 存 在 .一 个 关键 性 的 区 别 。 正确 思考 这 个 问 
题 的 方法 就 是 把 typedef 看 成 是 -种 彻底 的 “封装 ”类 型 一 一 在 声明 它 之 后 不 能 再 往 里 面 增加 
别 的 东西 。 它 和 宏 的 区 别 体现 在 两 个 方面 。 

首先 , 可 以 用 其 他 类 型 说 明 符 对 宏 类 型 名 进行 扩展 , 但 对 typedef 所 定义 的 类 型 名 却 不 能 
这 样 做 。 如 下 所 示 : 


#define peach jint 
unsigned peach ii， /* 没 问题 */ 
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unsignea panane i; zx 锚 误 ! 非法 < 


长 次 , 厢 连 续 儿 个 灾 意 鸭 贞 明 中 , 上 于 typedef 定义 的 坎 弄 能 够 保 讶 声明 条 所 存 的 灾 晶 芝 


加 一 种 类 型， 而 川 #define 定义 的 类 型 则 无 法 保证 。 旭 下 证 示 : 


tdéefine irt_ptr int * 
Nn ply chalk, chetese: 


经 过 安 扩展 ， 第 .- 行 变 为 : 

1mL * Chalk，Cleese， 

这 使得 chalk 利 cheese 成 为 不 同 的 类 型 ， 就 杂 象 是 癌 竹 沦 刁 细 理 秒 的 区 判 : chalk 是 
指 册 int 的 指针 ，]W cheese 则 是 一 个 int。 相 反 ， 下 二 的 代码 中 : 


tyoedcef char * char_ ptr; 
char_ptr Bentley, Foiis_Royce; 


为 


-个 


Bentiey 和 Rolls_Royce 的 类 型 依然 相同 。 虽 然 前 粤 的 类 漠 名 变 了 ， 人 它们 的 类 型 机 问 ， 


部 是 指 向 char 的 指针 ， 


3.7 typedef struct foof .… foo; } 的 含义 


C 庄 训 存在 多 种 名 字 空 间 ; 
。 标签 名 (label name)。 
。 标签 (tag): ea de 
。 成 员 名 ; 得 个 结构 或 联合 都 有 上 自 姥 的 名 学 袍 
。 其 他 . 


在 问 一 个 名 字 空 间 里 ， 任 何 名 字 必 须 上 共有 惟一 性 ， 亿 在 不 同 的 名 学 空间 里 可 以 存在 相隔 
的 名 宁 。 由 十 每 个 结构 或 联 台 具有 自己 的 名 字 空 间 ， 所 以 同一 个 名 学 可 以 出 现在 许多 不 辐 的 
结构 肉 。 有 些 很 老式 的 编译 蜂 尚 无 法 保证 这 :点 ,在 BSD4.2 核心 代码 由， 大 和 们 在 字段 名 前 


加 一 个 惟一 的 首 学 和 母 ， 部 分 就 是 由 省 这 个 原因 。 如 下 所 水 ; 


StLruc- vicde { 


lorg v_flag; 
long VvV_UusSecourt; 
ctruct veaec *sr_ Freer; 
strucl vrnaodeops wr_Op; 


二 
由 于 在 不 同 的 名 学 空间 为 合用 同一 个 名 字 是 合法 的 ， 所 以 有 时 可 以 看 刘 这 样 的 代码 ; 
slLruct fcoot int. too;}foo; 


这 显然 会 让 将 来 维护 这 用 代码 的 程序 员 感 到 困惑 和 滑 玫 。 你 说 sizeofffoo) 是 表示 呢 


69 


个 


C 专家 编 竹 

foo 呢 ? 
有 些 东 西 哆 加 稀罕 ， 桨 下 而 这 样 的 启明 涡 然 也 是 合法 的 : 
typedel siruct be “ int baz;! vaz; 


struct Par variable 2; 
bazw variable 2; 
太 多 的 “baz” 了 ! 让 我 们 换 一 些 清楚 的 和 名字， 再 试 - 试 : 
typeder strunt mr _ tag { int i;} my_types 
SLruct. mr Lag Variable 1: 
my_type varjaple xz 
这 个 typedef 声 崩 引入 了 my_type 这 个 名 字 作 为 “struct my_tagf inti; } ”的 简写 形式 。 但 
管 同时 也 引入 了 结构 标签 my_tag， 和 在 它 前 面 加 个 关键 子 stmet of 以 表示 同样 的 意思 。 如 果 你 
用 问 - 个 标识 符 表示 结构 类 型 和 typedef 正明 引入 的 标签 , 寺 么 以 后 使 用 这 个 标识 符 时 前 别 就 
个 必 有 上 关键 字 “struct” 了 ， 但 这 个 方法 向 人 们 灌输 了 一 种 完全 错误 的 思维 方式 , 令 人 不 快 
的 是 ， 这 种 与 结构 有 关 的 typedef 声明 的 次 法 确切 地 上 反 腿 了 组 合 结构 类 型 与 宰 量 声明 的 洁 法 ， 
所 以 ， 上 尽管 下 面 两 个 声明 其 有 相似 的 形式 ， 
tyoedef struct fruit{ int weignt, Erice_ per_lb; }fryii; /* 语句 1 */ 
struct weg{ int weight, price_ per_lb; }veg: 1* 语 旬 2 */ 
但 它们 代表 的 意志 却 完 全 不 -- 样 ， 诸 名 1 声明 了 结构 标签 “fruit” 和 由 typedef 声明 的 结 
构 类 型 “fruit”， 基 实际 笋 果 如 下 ; 
struct fruii mandarin;  /* 使 用 结构 标签 "fruit" */ 
fruit mandarin;  /* 使 用 结构 类 型 "fruiz" yy 


语 仙 2 声明 了 结构 村 答 “veg” 和 变量 veg。 只 有 结构 标签 能 够 在 以 后 的 声明 中 使 用 ， 如: 


名 LUCE veg potato; 
如 果 试 图 使 用 veg cabbage 这 样 的 声明 ， 将 是 一 个 错 识 。 这 有 点 类 似 下 而 的 写法 ; 


irit 二 


——- 








不 要 为 了 方便 起 见 对 结构 使 用 typedef。 
这 样 禾 惟一 的 好 处 是 能 使 你 不 必 书 写 “struct” 关 键 字 ， 但 这 个 关键 字 可 以 向 你 提示 一 些 
信息 ， 你 不 应 该 把 它 省 返 。 
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typcdef 应 该 用 在 : 

， 数组、 结构、 指针 以 及 还 数 的 组 合 类 型 ， 

: 可 移植 类 型 。 比 -如 当 你 需要 一 种 至 少 20 比特 的 类 型 时 ， 可 以 对 它 进 行 typedef 操作 
typedef 的 提示 声明 , 这样, 当 把 代码 移植 到 不 同 的 平台 时 . 要 选择 正确 的 类 型 如 short,int,long 
时 、 只 要 在 typedef 中 进行 修改 就 可 以 了 ， 无 需 对 每 个 声明 都 加 以 修改 ， 

typedef 也 可 以 为 后 面 的 强制 类 型 转换 提供 一 个 简单 的 名 字 ， 如 : 

iypedef int ‘ptr_to,_int_fur? (void}; 
Shar -™ Bs 
- {pCr to_int_fun) p; 

应 该 始终 在 结构 的 农 义 中 使 用 结构 标签 ， 即 使 它 并 非 必 须 。 这 种 做 法 可 以 使 代码 更 为 清 

晰 。 


ee re FE Eh errnnv， RT A TE TN NERANT eS A mana arerers Payrer 个 ov 





当 你 有 两 个 不 同 的 友 西 时 ， 在 计算 机 科学 中 一 个 比较 好 的 原则 就 是 用 不 同 的 名 字 来 称呼 
它们 。 这 样 做 减少 了 泥 清 的 危险 (这 始终 是 软件 的 -个 重要 准则 )， 婚 果 有 有 可 能 搞 不 清 哪个 名 
字 是 结构 标签 ， 就 为 它 取 - -个 以 “_tag” 结尾 的 名 字 。 这 使 得 罪 认 -- 个 特定 的 名 字 灾 得 简单 ， 
这 样 ， 将 来 维护 你 的 代码 的 程序 员 不 仪 不 会 咒骂 ， 相 反 会 很 感激 你 。 


3.8 “理解 所 有 分 析 过 程 的 代码 段 


你 可 以 轻松 地 编写 - -个 能 够 分 析 C 和 语言 的 声 叫 并 把 它们 翻译 成 通俗 语言 的 程序 .事实 上， 
为 什么 不 呢 ? C 诸 言 声明 的 基本 形式 已 经 描述 清楚 。 我 们 所 需要 的 兵 是 编写 … 段 能 够 理解 店 
明 的 形式 并 能 够 以 图 3-3 的 方式 对 声明 进行 分 析 的 代码 。 为 了 简单 起 见 , 轿 晶 忽略 错误 处 理 ， 
而 且 在 丸 理 结构 、 枚 举 和 联合 时 只 简单 地 用 “struct”，“enum” 和 “union ”来 代表 它们 的 县 
体内 容 。 节 后 ， 这 个 程序 假定 通 数 的 括号 内 没有 参数 列表 。 





Tv 


编程 挑战 

编写 一 个 程序 ， 把 C 语言 的 声明 翻译 成 通俗 语言 

这 里 有 一 个 设计 方案 。 主 要 的 数据 钻 构 是 一 个 堆栈 ， 我 们 从 堪 向 右 读 取 ， 把 备 个 标记 依 
次 压 入 堆栈 ， 直 到 读 到 标识 符 为 止 。 然 后 我 们 继续 向 右 读 入 一 个 标记 ， 也 就 是 标识 符 圳 边 的 
那个 标记 。 接 着 ， 观 察 标 识 符 左边 的 那个 标记 { 需要 从 堆栈 中 弹出 ) 。 数 据 结 构 大 致 如 下 : 


struct token { char type:; 
cnas string{MAXTOKENLEN]; }; 





?1 
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pr* 保存 第 一 全 标 说 之 前 的 打 有 标记 *7 


struct taoker stack [VAXTOKESNS]: 


/* 保存 出 读 入 的 那个 标记 */ 


struct Loken Lhis; 


伪 码 如 下 : 
实用 程序 
classify_ string( 字 符 串 分 类 ) 
个 看 尖 前 的 标记 ， 
通 讨 this,.Lype 返回 一 个 值 ， 内 容 为 "cype【 类 型) "。，"qa:alisjier (限定 符 } "或 
"indencifier (标识 料 1 
gettoken ( 取 标 记 】 
把 下 一 -个 标记 读 入 this,string 
邵 果 是 字母 数字 组 合 ， 调 用 classify_string 
否则 ， 它 必 是 一 个 单字 符 标 记 ，Lhis .type = 该 标记 : 平一 个 rl 结束 this,stlrirs 
rcad,_to_first_identi:-ier ( 读 至 第 一 个 标识 答 ) 
调用 gettoxen， 并 把 标记 床 入 到 堆栈 中 ， 直 到 遇见 第 一 个 标识 符 . 
Print"identifier :is (标识 符 是 )'， chis.string 
急 续 调用 gettoken 


解析 程序 
deal_with_ function_algs ( 处 理 函 数 参 数 ) 
当 读 取 越过 右 括号 “) ”后 ， 打 印 “ 函 数 返 回 ” 
deal_with_arrays ( 处理 函数 数组 ) 
当 你 读 取 " [size] "后 ， 将 其 打印 并 急 续 向 右 读 取 ， 
deal_with_any_pointes {处 理 任何 指针 ) 
当 你 从 堆栈 中 读 取 "* ' 时 、 打 印 " 指 向 ,. .的 指针 "并 将 其 弹出 境 栈 ， 
Geal_with_ Geclarator ( 处 理 声明 器 ) 
if this,type is ' deal with arrays 
if this.Lype is ‘{ Geal_with_ function_args 
deal_with. any_pointers 
while 堆栈 里 还 有 东西 
if 它 是 一 个 左 括号 “{ 
将 其 弹出 堆栈 ， 并 调用 yetLoken; 应 该 获得 在 括号 “ff 
deal_with decilaratior 


else 将 其 弹出 堆栈 并 打印 它 


hin 
read_to. first_ident:fier 
Qeal_with_declarat.or 


rr EE ET 
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这 是 一 个 小 型 程序 ， 在 过 去 的 儿 年 中 已 被 编写 过 无 数 次 ， 通 常 取 名 为 “cdecL ”。The C 
人 Language 让 一 个 cdecl 的 不 完整 版 本 ， 本 蔬 的 cdecl 程序 则 更 为 详尽 .。 它 支 持 类 
型 限定 符 const 和 volatile。 同 时 它 还 涉 凡 结构 ， 枚 举 和 联合 ， 尽 管 在 这 方面 作 了 简化 ,你 可 
以 很 轻松 地 用 这 个 版 本 的 程序 来 处 理 消 数 中 的 参数 声明 。 这 个 程序 可 以 用 大 约 150 行 C 代码 
实现 。 如 果 可 入 错误 处 理 ， 并 使 程序 能 够 处 理 的 声明 范畴 更 … : 些 ， 程 序 就 会 更 长 一些。 无 
论 如 何 ， 当 编制 这 个 解析 器 时 ， 相 当 十 赴 在 实现 编 详 器 中 十 要 的 子 系统 之 一 一 一 这 是 -- 个 相 
当 了 不 起 的 编程 成 就 ， 能 够 帮助 你 获得 对 这 个 领域 的 深刻 理解 。 


更 多 阅读 材料 


既然 你 已 经 精通 了 在 怠 诸 所 中 创建 数据 结 梅 的 方法 ， 可 能 会 对 那些 讲述 通用 日 的 的 数据 
结构 忆 感 兴趣 。 其 中 一 本 是 Data Structmres with Abstract Data Types, Daniel FStubb 和 Neil 
W.Webre 著 ， 第 二 版 ，Pac fic Grove, CA, Brooks/Cole, 1989。 

这 本 书 覆 盖 了 范围 很 广 的 数据 结构 ， 包 括 字 符 串 、 列 表 、 堆 栈 、 队 列 、 树 、 堆 、 集 合 和 
图 。 我 推荐 此 书 。 


3.9 轻松 一 下 一 一 虹 动 物理 实体 的 软件 


ee -就 是 编写 软件 来 控制 一 些 物理 实体 〈 如 机 器 人 的 手臂 和 磁盘 
的 磁头 ) 的 运动 。 只 时 启动 一 个 程序 ， 现 实 世 界 的 东西 使 在 程序 的 控 抽 下 发 牛 移动 ， 此 时 心 
中 便 会 油 然 生 起 一 股 得 意 之 情 ， MIT 人 上 管 能 实验 军 的 研究 生 们 下 是 由 于 这 方面 的 热情 ， 才 
把 系 里 的 计算 机 连接 到 九 楼 的 电梯 按钮 上 ， 这样， 只 要 在 你 的 LISP 机 器 上 -键入 一 条 命令 ， 
就 能 控制 电梯 的 升降 ! 这 人 程序 在 运行 时 要 经 过 仔细 核查 ， 确 信 运 行程 序 的 终端 确实 位于 实 
验 室内 部 时 ， 它 才 对 电梯 的 升降 进行 控制 。 这 是 为 了 防止 黑客 使 用 这 个 程序 故意 卡 住 实验 富 
的 电梯 。 

计算 机 编程 的 另 一 个 巨大 乐趣 就 是 利用 非常 手段 从 食物 残 洼 申 再 虽 出 点 味道 来 ,所 请 * 亦 
废 为 宣 ” 踊 。 当 然 ， 把 这 两 样 刺激 的 事 合 而 为 一 的 想法 也 是 寝 为 白 然 的 。 上 阴 基 - 梅 隆 
(Carnegie-Mellon) 大 学 计算 机 科学 系 的 一 些 研 究 生 开发 了 .种 计算 机 接口 , 重新 利用 了 -一 项 诛 
有 的 已 经 远离 人 们 关注 范 国 的 技术 成 果 ， 解 决 了 一 个 长 期 困扰 他 们 的 问题 ， 计 算 机 科学 系 的 
可 口 可 乐 机 位 于 3 楼 ， 离 这 些 研究 生 的 办 公 室 很 远 。 这 些 学 生 们 已 经 厌倦 了 跑 这 么 远 的 路 ， 
到 了 那里 却 发 现 可 乐 机 已 经 室 了 ,成 更 糟 ,可乐 机 刚刚 填 满 ， 这 时 全 到 的 可 乐 还 不 够 凉 1John 
Zsamey 和 Lawrence Butcher 发 现 可 乐 机 把 所 有 的 本 乐 储 存在 6 个 冰柜 里 , 每 个 冰柜 都 有 一 过 
“ 罕 ” 灯 ， 当 它 向 外 发 送 一 振 可 乐 时 ， 灯 时 便 闪 烁 ， 如 果 冰 柜 中 所 有 的 可 乐 都 售 完了 灯 就 一 直 
亮 者 。 把 这 些 灯 接 到 串 行 口 ， 把 “正在 发 放 可 乐 ”信息 传送 到 系 里 的 PDP-10 大 型 机 应 该 不 
是 件 用 难 的 事 . 这 样 , 可乐 太 的 接口 看 上 去 就 像 是 一 个 telnet 连接 !Mike Kazar 和 Dave Nichols 


” 不 要 把 它 跟 PC 上 的 CAC++ 编 详 器 牙 缺 省 使 用 的 函数 调 定 约定 cdecl 滋 为 痰 。 
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编 与 了 软件 ， 它 能 够 村 查 徇 作出 四 应 ， 并 能 够 查 到 哪个 冰柜 里 的 可 乐 最 冰 。 

白 然 ，Mike 种 Dave 并 没有 就 此 止步 他们 又 设计 了 - -个 网 络 协议 ， 当 地 以 太 网 上 上 的 任 
何 一 台 机 器 查询 林 忒 机 的 状态 时 ， 大 型 机 部 能 给 予 回答 。 最 后 ， 其 全 是 来 日 内 和 煌 网 的 在 淘 也 
能 得 公 问 答 。Jyor Durham $: 纲 了 这 个 软件 来 完成 这 项 1 和 作 , 能 够 从 其 他 机 器 上 检查 可 乐 机 的 
状态 。 任 从 其 令 人 称道 的 丝 济 头脑 ，Tver 复 用 了 标准 和 的 “finger” 程 序 - 一 这 个 - - 般 用 于- 在-- 
侣 机 器 上 上 检查 一 位 确定 的 用 户 是 否 在 男 一 台 机 器 .上 登 水 的 程序 。 他 修改 了 “finger” 的 服务 右 
并 ， 和 反潜 有 人 使 用 不 存在 的 用 户 名 “coke” 执 行 finger 程序 时 ， 它 便 会 运行 可 乐 机 状态 查询 
程序 . 出 工 finger 请 求 是 Irternet 标准 协议 移 一 部 分 ， 所 以 人 人 们 可 以 从 任 体 CMU 计算机 二 售 
询 可 乐 机 的 状态 。 事 实 上 上 上， 通过 运行 下 面 的 命令 : 

£1inNnger cokeeg .gp.cru,edu 

可 以 从 Internet 的 任何 一 个 机 器 上 但 询 到 该 可 乐 机 的 状态 ， 即 使 起 隐 在 十 早 之 外 。 

参与 这 项 工程 的 人 还 有 Steve Berman，Eddie Caplanp，Mark Wilkins 和 Mark Zaremsky”。 
这 个 可 乐 机 查询 程序 的 使 用 时 间 超 过 了 10 年 。 当 20 世纪 80 年 代 早期 PDP-10 被 淘汰 上 时， 他 
们 甚 全 又 为 UNIX Vaxen 性 新 编写 了 程序 。 肖 到 几 年 前 ， 这 个 程序 才 结 束 其 内 史 使 命 ， 关 为 
当地 的 可 乐 撼 装 疝 停 目 使 月 这 种 可 以 回 软 的 、 可 乐 狂 形状 的 瓶子。 出 于 康 来 的 旧 古 乐 机 无 法 
使 用 新 形状 的 可 乐 犯 ， 于 旦 它 被 一 台新 的 售 货 机 所 取代 ， 而 新 机 器 需要 新 的 接口 才能 实现 查 
漳 。 一 时 间 ， 没 人 接手 这 寻 。 伯 嘟 啡 因 的 诱惑 县 终归 伟 Greg Nelson 为 浙 机 器 重新 设 汗 了 碍 
产程 序 。CMU 的 研究 生 们 同时 把 糖果 机 也 接 到 计算 机 上 ， 其 他 学 校 也 纷纷 效仿 类 仅 的 项 上 日 。 

册 澳 大 利 亚 大 学 的 计算 机 俱乐部 把 -- 台 可 乐 机 连接 到 一 台 68000CPU、 内 存 80KB、 具 有 
以 太 网 接口 的 机 闪 在 20 世纪 80 年 代 中 期 ， 这 个 配置 比 一 般 的 PC 要 强 很 多 ) 十 。 信 于 组 
约 岁 切 期 特 的 罗切斯特 理 |- 学 院 (Rochester Institute of Technology) 的 计算 机 科学 所 也 把 一 台 
可 乐 机 连 上 了 Internet， 基 对 功能 作 了 扩展 ， 人 允许 用 户 使 用 信用 卡 或 计算 机 帐户 支付 。 有 个 学 
汪 整 个 回 假 都 喜欢 从 家 时 登录 到 几 百 英里 还 的 可 乐 机 . 卡 ， 有 时 兴 之 所 至 ， 为 下 - -位 登录 并 氟 
费 提 供 饮料 。 一 时 间 ， 可 乐 机 似乎 很 快 将 成 为 Intemet 上 最 常见 的 使 件 系统 ， 

为 什么 只 局 限于 可 乐 机 呢 ? 去 年 圣诞 节 ，Cygnus Support 的 程序 员 们 把 他 们 的 巴 诞 媒 装 
饰物 连 到 以 太 网 上 。 这 样 ， 他 们 便 可 以 通过 于 作 妆 控制 好 火 的 闪 灭 ， 从 中 体验 快感 。 人 们 担 
心 日 本 在 技术 方面 会 领先 美国 ! 在 Sun Micorsystems 内 部 ， 有 一 个 E-mail 地址 可 以 白 动 转换 
到 一 -个 带 有 传真 功能 的 调制 解 调 器 上 。 当 你 用 这 个 地 址 发 送 E-mail 时 ， 它 会 进行 解析 ， 取 得 
电话 号 码 的 细节 ， 并 作为 传真 发 送 。 顶 级 程序 中 Don Hopkins 编写 了 pizzatool 程序 ， 充 分 了 
利用 这 个 功能 。pizzatool 使 用 了 GUI 界面 ,让 你 自己 选择 浇 在 比萨饼 上 钓 奶油 ( 绝 大 多 数 用 
户 都 自行 指定 附加 的 GUI 奶 酷 ?， 并 用 传真 把 定单 发 到 附近 的 Tony & Alba's 比萨 餐厅 ， 那 里 
可 以 党 理 传 真 订单 ， 他 们 会 把 比萨 饼 送 过 来 。 


' Carmegie-Mellon University. 


” Craig Everhart, Eddie Caplan Pl Rovert Frederking," Serious Coke Addiction, "25 Anniversary Symposium, Compurer Seience oi CMU: 
A Commemorative Review, 1990,p.70.Recd and Witting Company. 
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正当 这 种 服务 的 用 途 不 断 扩 展 之 时 ，SUN 公司 的 SPARC 服务 器 600MP 系列 计算 机 本 在 
实验 室 时 紧锣密鼓 地 开发 章 。 我 想 我 透 器 这 个 传 总 还 不 化 于 石 没 路 商业 机 密 之 嫌 ， 





20 
21 
22 
如 学 
24 
25 
26 
27 
28 
29 
aC 
3 二 
32 
33 
34 
3:5 
46 


解决 方案 


fincluae <stdlc .hi> 
#irclude <scrinc.h> 
tinslude <ctype.t>» 
tinclude <sLd in. 
#4dcfine MAXTOKENS 100 
Hdefirne MAXTOKRFMNLEN 64 


onim type_cayg { LDENTIFIER, QUALITIESR, TYPE | 


sLruct tokcn i 
char type; 
Ca strinc[MZxTORENLEN]:; 


int top = -1; 
strict token etacr [MAXTORENSI}: 
struct token this， 


tdefine pop stack[top--] 
tdefine Pushfs) stack[++top) = 8s 


enum type_tag classify_string {void} 
1* 推断 标识 符 的 类 型 */ 
{ 
char *s = this,.string; 
if{listroempls, "const"})}f 
strcpyils, "read-cnly"); 
return CUALIFIER; 
} 
if{istrcempts, "volatile")} return QUALIFIER; 
if{lstrcomm{s, "void")}} rerurn TYPE; 
if(l!istrempls, "char"})) return TYPE,; 
ifi!istremp(ls, "signed"})}}) return TYPF,; 
if{!strcmpls, "unsigned"}} retun TYF5， 
ift!lstrcmpls, "short")) return TYPE; 
ifilistrempt{s, "int"})}) returr TYPE; 


tras NT ED ed dF ap AA NN ST NL 


MR RA EE - 岂 re 
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46 void gettoken(void) jy* 读 取 下 一 个 社 记 到 “+ 


47 { 


60 


70 } 





if(t!strcmpts. "lJ]ong")} return TYPE; 
if'!'strcmmis, "float"}) recun TYPE:; 
if(l!Istroemp ts, "double")}) retvrn TYPR; 
ifistrcmpls, "struct*)}) retwn TYPbE; 
itf(llstreompls, "Mion")} return TYPE; 
iT{!lstroempls, "enum"}) reiun TYPE; 
return INDENTTFIMR,; 


char *p = this.stlring; 


whilet{{*p = getchar(})) == ' '): 


iftisalnum(*p}} 1 
yx 读 入 的 标识 符 以 A-2z，0-3 开头 。 */ 
whilelisalrnum(*++p = getchar(}}); 
Ungctet*p, stdin}; 
xpP = '\0'; 
this.type = classify_ string(},; 
return; 


if (*p == '*'} 1 
strcpy {this.string, "pointer to"); 
this.type = '*'} 


return; 
了 
ttSs。Sstzringl-] = '\0'， 
this.type 一 *p:; 
return; 


71 /* 理解 所 有 分 析 计 程 的 代码 段 */ 


72 read to., first_ identifer() f{ 


3 
7 了 4 
和 5 
?76 
i 
78 
?9 
80 } 
8 


gettokent),; 
whiletthis.tyre != IDENTIFIER) { 
pushlthis),; 
gettoken{}:; 
} 
printf{"%s is ", this.string’; 
gettokent():; 


82 Goeal. with arrayst. { 


?76 


vy 
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83 whiletnisiyne == "['] { 

84 orintL[Li"array "); 

gb gettokeni); yx 数字 或 :ve7 

8b :trisdigic {this.string ol)) 1 
2'j prinsf("0..%d ", aoi(ihis.stLr-ngi -1); 
28 gettckeni); zx 读 了 到 ']' #*/ 
83 j 

车 已 忆 CLLOKeC /* 读 取 '1' 之 后 的 天 -个 床 记 */ 
531 DETTES(YTE 2}s 

32 } 

93 ; 

4 

95 cdcal_with, tuncticor args() { 

96 whijelrhis.type 1= ')') 

97 ef LOKemT  ， 

38 } 

99 gettokent(:,; 

10n print* ("funct on returning "); 
10、 1} 

102 

103 deal_with poircterst() 1{ 

104d whilelstacktk top] .type =- 和 xx ) 1 
105 BTInLETTSB ", pop.strirg ) ; 
108 } 

TO 3 

108 


109 deal_witn declarator{} { 


110 /* 处 理 标 识 乱 之 后 可 能 存在 的 数组 /前 数 */ 


芝 主 二 switchithis..type) 1 

112 case '[' : deal_with arrays(); break; 
112 case '{(' : deal_with_function argst{’): 
114 } 

115 

118 Geal_ with rointerst{},; 

117 


118 /* 处 理 在 读 入 .到 标识 符 之 前 压 入 到 堆栈 中 的 符 吕 */ 
119 whileitop >= 0} f{ 


120 ift (stack[top] .type == '(' ) { 

121 Pop? 

122 gettLoken(}; yx 读 取 “)” 之 后 的 符号 */ 
L123 deal with. declarator{}; 

124 }else { 

125 prin-f("%s ", pop.string); 

126 } 

127 1 

128 } 
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129 

130 raini} 

J 

132 1* 将 标记 庄 入 淮 栈 中 ， 直 到 亲 见 标识 符 */ 
133 read to fir:st :dentifier:}: 

134 deal_with | 

135 Prirnitf( "I 

36 ICLUED 日 ， 

137 
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使 字符 串 的 比较 看 上 去 更 自然 
stremp0) 玉 数 用 于 比较 酒 个 字符 事 , 它 所 存在 的 其 中 一 个 问题 是 : 当 两 个 字符 串 相等 时 函 
数 的 返回 值 为 零 . 当 字 符 串 比较 是 条 件 语 句 的 一 部 分 时 ， 这 个 问题 就 会 导致 今 人 费解 的 代码 : 
if(l!stromp{ls, rolatlile")) retirr QUALIFIFR,; 
返回 值 零 使 条 件 语 多 的 结果 为 假 ， 所 以 我 们 不 得 不 对 其 取 反 ， 得 到 我 们 需要 的 结 
这 里 有 一 个 更 好 的 方法 。 建 立 宏 定 义 : 
Hdefine STRCMF(a, R, pb) {strerp (la, b) R 0) 
现在 你 可 以 以 自然 的 及 . 格 来 编写 代码 
if (STRCMP {s, ==, "volatile"}) 
使 用 这 个 宏 定义 ， 代 码 可 以 用 更 自然 的 风 客 来 表示 它 的 意思 。 请 用 这 种 字符 串 比 较 风格 
重新 编写 cdecl 程序 ， 看 看 你 是 否 更 喜欢 这 种 方式 。 


ann ee 





解决 方案 





分 析 一 个 C 语言 的 声明 《又 一 实例 ) 
这 是 第 78 页 “这 个 声明 表示 什么 ”的 解答 。 在 每 一 个 步骤 中 ， 我 们 所 处 理 的 那 部 分 声 
明 以 粗 体 字 表 示 。， 从 第 一 步 起 ， 我 们 将 依次 处 理 下 列 步骤: 
剩余 的 声 阴 下 一 步 要 进行 的 步骤 结 果 
从 最 左边 的 那个 标识 符 开 始 
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第 3 章 分 析 C 语 言 的 声明 
续 表 
剩余 的 声明 
char *#f#eFlO0])Gint **p ); 
char *(* [10])Cint *#Py) ; 


char *{* nt **p) ; 





下 一 步 要 进行 的 步骤 
第 1 步 
第 2 步 





表示 "的 教 组 [0.9|" 

表示 "指向 ... 的 指针 " 

转 到 第 4 步 . 

去 掉 两 边 括 号 ， 转 到 第 2 步 ， 
再 接着 执行 第 3 步 

表示 "返回 .的 函数 " 










char *( Hint **p) : 


char * (int **p) : 
char * ; 表示 "指向 .的 指针 
char ; 表示 "char'" 





然后 把 它们 妇 纳 在 一 起 ， 读 作 : 

“c 是 一 个 数组 [0..9]， 它 的 元 素 类 型 是 函数 指针 ， 其 所 指向 的 阴 数 的 返回 值 是 一 个 指向 
char 的 指针 ” 。 

顺和 到 完工 .注意 : 在 数组 中 被 函数 指针 所 指向 的 所 有 函数 都 把 一 个 指向 指针 的 指针 作为 
它们 的 惟一 参数 ， 





OE Evaroywss 本 间作 wiki or yeririrriririnaceereyarwwmrvws wwvurowcsmaaararerw senantrrryme mms 
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4 
草 


令 人 震惊 的 事实 : 数组 和 指针 并 不 相同 








数组 的 下 标 应 该 从 0 还 是 从 荆 开 始 ” 我 提议 的 受 协 方案 是 0.5， 
可 惜 他 们 未 予 认真 考虑 便 一 口 回绝 。 
“Stan Kelly-Bootle 


4.1 数组 并 非 指针 


C 缩 积 新手 最 常 听 到 的 说 法 之 一 就 是 “数组 和 指针 是 相同 的 ” 不 可 有的是， 这 是 一 奸 人 和 常 
危险 的 说 法 ， 并 不 完全 下 确 。ANSIC 标准 6.5.4.2 建议 : 

注意 下 列 声 明 的 区 别 

exterrl irnt *x; 

xtern int Y[|; 

第 一 条 语句 声明 x 是 个 int 型 的 指针 ， 第 二 条 语句 声明 y 是 个 int 型 数组 ， 长 度 尚 未 确定 
( 不 完整 的 类 型 ) ， 其 存 鳍 在 别处 定义 。 

标准 并 没有 做 更 细 的 尘 定 .许多 C 语言 书籍 对 数组 与 指针 何 时 相同 、 何 时 不 同 含 精 其 藤 ， 
对 于 这 个 应 该 重点 团 述 的 舌 题 只 是 一 带 而 过 。 本 书 完 整地 解释 了 数组 什么 时 候 等 问 于 指针 ， 
什么 时 候 又 不 等 同 于 指针 以 及 原因 所 存 ， 从 而 补 上 了 这 一 谋 。 不 仅 如 此 ， 我 还 把 这 个 癌 题 作 
为 一 草 的 标题 大 硅 滨 染 ， 和 而 不 是 悄 无 声息 地 放 在 脚注 里 顺 使 提 一 上。 


4.2 我 的 代码 为 什么 无 法 运行 
常常 有 人 让 我 看 类 以 下 面 的 程序 ， 抱 每“ 它 无 法 运行 " 如果 每 次 我 都 能 拿 色 一 扎 钱 ， 你 
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C 专家 编程 
铬 现在 累积 起 米 有 多 少 了 ? 计 我 数 数 ， 哮 ， 共 不 多 月 好 几 元 了 
文件 1: 


int mango[100]; 


文件 2: 


extern inL *marigo: 


/x+ 一 些 引用 angoe[i| 的 代码 */ 

这 里 , 文件 1 定义 了 数组 mango， 介 文件 2 声明 它 为 指针 。 这 有 什么 错误 蚂 ? 无 沦 如 何 ， 
“每 个 人 都 知道 ”在 C 语 育 中 ， 数 组 和 指针 非常 相似 。 问 题 在 于 “每 个 人 ”这 种 说 法 是 错误 
的 ! 这 相当 十 把 整数 和 浮 点 数 混为一谈 : 

文件 1; 


int guava; 


艾 件 2: 

Extern float 9uava: 

卓 这 个 int 和 float 的 例子 非常 明显 ， 类 型 不 匹配 ， 没 人 会 指望 这 样 的 代 和 合 能 够 运行 。 
组 是 为 付 么 人 们 会 认为 指针 和 数组 始终 应 该 是 可 以 握 换 的 呢 ? 答案 古 对 数组 的 引 咱 总 是 可 以 
写成 对 指针 的 引用 , 而 有 确实 存在 种 指 计 和 数组 的 定义 完全 相向 的 上 上 下文 环境 不 率 的 是 ， 
这 只 龙 数 组 的 一 种 极为 普通 的 用 法 ， 并 非 所 有 情况 下 都 是 如 此 。 但 是 ， 人 们 却 自 然而 然 地 归 
纳 并 假定 在 所 有 的 情况 下 数组 和 指针 都 是 等 同 的， 包括 上 上 而 完全 错误 的 “数组 定义 等 回 十指 
针 的 外 部 声明 ”这 种 情况 . 


4.3 什么 是 声明 ， 什 么 是 定义 


在 搞 清 这 个 问题 之 前 ， 需 要 在 头脑 里 重新 粮 理 一 些 基本 的 C 诸 言 术语 。 记 和 住 ，C 语言 中 
的 对 象 必须 有 旦 只 有 -个 定义 ， 但 它 可 以 有 多 个 extern 声明 。 顺 便 说 一 下 ， 这 里 所 说 的 对 象 
中 C++ 中 的 对 象 并 励 关系 ， 这 里 的 对 象 只 是 跟 链 接 器 有 关 的 “东西 ”% 比如 函数 和 变量 ， 

定义 是 “种 特殊 的 声 且 ， 它 创建 了 -个 对 象 ;声明 篇 单 地 说 明了 在 其 他 地 方 创建 的 对 象 
的 名 子 ， 它 允许 你 使 用 这 个 名 字 。 让 我 们 回顾 一 下 这 两 个 术语 ; 





定义 只 能 出 现在 一 个 地 方 确定 对 象 的 类 型 竹 分 配 内 存 ， 用 于 创建 新 的 对 象 。 例 如 : int] 
my_array[100]; 
声明 nj 以 多 次 出 现 描述 对 象 的 类 型 , 用 丁 指 代 其 他 地 方 定义 的 对 象 ( 例 如 在 其 他 交 件 里 ) 


例 ，extem int my_array[]; 





第 4 章 ， 令 人 震惊 的 事实 ;数组 和 指针 关 不 相 因 


EWEN AAR ew A EE NE NY YN A AA Ne LAAN We Ae fe Fr Be 
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区 分 定义 和 声明 


只 要 记 住 下 面 的 内 容 即 可 分 清 定义 和 上 声明: 
声明 相当 于 首 通 的 声明 : 它 所 说 明 的 并 非 自 身 ， 而 是 描述 其 他 地 方 的 创建 的 对 象 ， 
定义 相当 于 特殊 的 声明 : 它 为 对 象 分 配 内 存 。 


Mt NM AA A se rr， 


extern 对 象 声 明 占 诉 编 详 器 对 象 的 类 型 和 和 名 宁 ， 对 象 的 内 存 分 配 则 在 别处 进行 。 由 于 并 
本 企 点 明 中 为 数组 分 配 内 存 ， 所 以 并 不 需要 提供 关于 数组 长 度 的 信息 。 对 于 多 维 数组 ， 册 要 
提供 除 最 看 边 一 维 之 外 其 他 维 的 长 度 一 一 这 就 给 编 详 器 足够 的 信息 产生 相应 的 代 三 . 


4.3.1 数组 和 指针 是 如 何 访问 的 
本 让 我 们 讲述 对 数组 钓 引用 和 对 指针 的 引用 有 何不 同 之 处 。 首 先 需要 注意 的 是 “地 址 y" 
和 “地 引 y 的 内 容 ” 之 问 航 区别。 这 是 个 相当 微妙 之 处 ， 因 为 在 人 多 数 编程 谨 主 中 我 们 川 


问 -… 个 符号 来 表示 这 两 样 尔 册 ， 由 编译 器 根据 上 下 文 环 境 判 断 它 的 具体 含义 。 以 -个 箭 单 区 
赋值 为 例 ， 见 图 4-1。 


在 这 个 上 下文 斥 境 里 ， 符 导 飞 件 这 个 二 下文 环 境 时 ， 符 号 了 

的 滞 义 是 多 所 代表 的 地 址 ， 的 含义 是 立 所 代 直 的 地 址 的 内 容 . 
这 被 称 为 括 值 。 这 被 称 为 右 值 ， 

左 们 在 编译 时 中 殷 ， 讽 怕 表 在 介 贞 到 这 行 时 才 知 ， 如 [无 特色 说 册 ， 
示 存 情结 果 的 地 六 。 碳 值 表 水 “YY 的 内 容 "， 


C 庄 言 引入 了 “修改 的 左 值 ” 这 个 术语 。 它 小 示 不 值 允 许 出 现在 赋值 语 各 的 左边 ,这 个 奇 民 的 
术 活 是 为 与 数组 名 区 乡 ， 数 姐 名 也 用 于 彤 定 对 象 在 内 存 中 的 位 置 ， 也 是 左 值 ， 但 它 不 能 作为 赋值 的 对 
象 , 内 此 ， 数 纽 名 是 个 左 值 但 不 是 订 修 改 的 左 值 。 标准 规定 赋值 符 必 须 用 可 修改 的 左 值 作为 它 左边 - 
便 的 操作 效 。 用 通俗 的 话说 ， 只 能 给 下 以 簿 改 的 东西 感 值 。 


图 4-1 地 址 《 左 值 ) 和 地 址 的 内 容 《〈 右 值 ) 之 间 的 区 别 
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C 专家 编程 
出 现在 赋值 符 左 迪 的 符号 有 时 被 称 为 太 值 “出 于 它 位 于 “在 手边” 或 “ 圾 本 地 点 瓦 ， 出 
现在 赋值 符 右 边 的 符号 有 填 则 被 称 为 在 值 《 出 于 它 位 丁 “ 右 于 边 和。 编 详 器 为 等 个 变量 分 配 
一 个 地 址 : 左 佑 ?。 这 个 邮 基 :在 编 详 时 可 知 ， 而 二 该 变量 在 运行 时 一 下 保存 于 这 个 地 址 。 机 芭 ， 
在 储 本 变量 中 的 值 〈 它 的 有 值 ) 只 有 在 运行 时 才 可 逢 ， 志 巢 计 要 用 到 变 明 中 存储 的 位， 编译 
器 就 发 出 指令 从 指定 地 址 读 入 变量 值 并 将 它 存 十 寄存 器 中 。 
这 由 的 关键 之 处 在 于 入 个 符号 的 地 址 在 编 译 时 相逢 。 所 以 ,外 采编 详 替 击 要 - 个 地 址 ny 
能 偿 帘 要 加 上 仙 移 汇 ) 来 捧 行 其 种 操作 ， 它 中 可 以 站 接 进 行 操作 ， 并 不 涛 时 增加 指令 首先 取 
得 具体 的 地 十 。 相 反 ， 对 于 指针 ， 必 须 首先 在 运行 时 取得 它 的 当前 但 ， 然 后 才能 对 它 进行 解 
除 引 用 操作 作为 以 后 进行 查找 的 步 又 之 …)。 图 A 展示 了 对 数组 下 标的 引用 ， 
char af9| = "abedefgh”, ee c=alil: 
编 详 器 生 导 去 具有 一 个 地 址 9980 


运 丰 只 步 紧 1 求 1 的 做， 疗 它 与 9980 于 所 | 
运行 时 步 呈 2， 下 地 址 9980+i) 的 内容. 


Fe | 
0980 +l 2 4 +4 .. +i 


图 A 数组 的 下 标 引 用 


这 屿 是 为 秆 人 么 extern char a[] 与 extern char af100| 等 价 的 诛 内 。 这 两 个 声明 者 提示 是 
个 数组 ， 也 就 是 -个 内 存 地 址 ， 数 组 内 的 字符 可 以 从 这 个 地 址 找到 。 编 详 器 并 不 谎 竖 知道 数 
组 总 睦 丰 多少 长 ， 因 为 它 具 产生 俩 离 起 始 地 钼 的 偏 移 地 址 。 从 数组 提取 一 个 学 符 ， 肉 要 简单 
地 从 符号 衣 显 示 的 a 的 地 址 加 上 下 标 ， 需 要 的 字符 就 位 于 这 个 地 址 中。 
相反 ,如 朵 点 明 extern char *p, 它 将 告诉 编 详 器 p 是 一 个 指针 (在 许多 现代 的 机 器 里 它 是 
个 四 字 节 的 对 象 )， 它 指 局 的 对 象 是 -一 个 字符 : 为 了 取得 这 个 字符 ， 必 须 得 到 地 址 p 的 内 容 ， 
把 它 作 为 学 符 的 地 址 并 从 这 个 地 址 中 取得 这 个 学 符 。 指 针 的 访问 要 灵活 得 多 ， 但 袁 监 增加 一 
次 额外 的 提取 ， 如 图 了 B 所 示 。 
chir *p 二 cab; 
渔 译 品 符 他 去 存 一 个 符 呈 bp， 它 的 地 址 为 4624 


运行 时 步骤 1: 也 地 二 4624 的 内 容 ， 就 四 :5081 
运行 时 步 蚤 2: 取 地 引 5081 的 内 容 。 


orn 


~ 4624 S081 
图 B 对 指针 的 引用 
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4.3.2 当 你 “定义 为 兹 针 ， 但 以 数组 方式 引用 ”时 会 发 生 什么 


现在 让 我 们 看 -下 当 一 个 外 部 数组 的 实际 定义 是 :个 指针 ， 介 却 以 数组 的 方式 对 其 引用 
叶 ， 会 引起 什么 问题 。 需 竖 对 内 存 进 行 直 接 的 引用 (如 图 A 所 示 }， 但 这 时 编译 器 所 执行 的 
芭 是 对 内 存 进 行 间接 引用 “如 图 B 所 示 )。 之 所 以 会 如 此 ， 是 因为 我 们 告诉 编译 嚣 我 们 拥有 
的 古 一 个 指针 ， 如 图 CC 所 水 。 


char *p = "abedefgh": ¢ = Pp[U], 


编译 器 符 印 表 具 有 一 个 p， 则 址 为 4624 
这 行 时 步 双 1， 到 地 址 4624 的 内 容 ， 即 “5081' 
运行 时 步骤 2: 取得 1 的 箱 ， 并 将 儿 与 5081 相 加 ， 
迹 行 时 步 琉 3:， 取 地 是 fs5081+i] 的 内 容 ， 


NE {5081+i) fi 
4624 


3S081 +] +2 +3 +4 ... +1 
图 C 对 指针 进行 下 标 引 用 
对 申 图 C 的 访问 方式 ， 
char *p = “abcdefgh"; ... p[3] 
利 图 A 的 访问 方式 : 
char ai] = "abcdefgh”; ... al3] 
在 这 此 种 情况 下 ， 都 可 以 取得 字符 4， 但 两 者 的 途径 非常 不 ，- 样 
当 书 号 了 extern char 'p， 然 后 用 p[3j 来 引用 其 中 的 元 素 时 ， 其 实质 是 图 A 和 图 B 访问 方 
式 的 组 合 。 首 先 ， 进 行 图 3 所 示 的 间接 引用 。 然 后 ， 如 图 A 所 示 用 下 标 作 为 偏 移 量 进行 自 接 
访 门 。 更 为 正式 的 说 法 是 ， 编 详 器 将 会 : 
上. 取得 符号 表 中 p 的 地 址 ， 提 取 存 储 于 此 处 的 指针 ， 
2. 把 个 标 所 表示 的 偏 移 量 与 指针 的 值 相 加 ， 产 生 -个 地 址 。 
3. 访问 上 面 这 个 地 址 ， 取 得 字符 。 
编译 瞧 已 被 告知 p 是 - -个 指向 字符 的 指针 〈 相 反 ， 数 组 定义 告诉 编译 器 p 是 -个 字符 序 
列 )。p 站 表示 “从 p 所 指 的 地 址 开始 ， 前 进 i 步 ， 每 步 都 是 一 个 字符 〈 即 每 个 元 素 的 长 度 为 
一 个 字 节 )”。 如 果 是 共 他 类型 的 指针 《如 int 或 double 等 )， 其 步 长 (每 步 的 字 节 数 ) 也 各 不 
相同 。 
既然 把 p 声明 为 指针 ， 却 么 不 管 p 原先 是 定义 为 指针 还 是 数组 ， 部 会 按照 上 面 所 示 的 二 
个 步 又 进行 操作 ， 但 是 欠 有 当 p 原来 定义 为 指针 时 这 个 方法 才 是 正确 和 的。 考虑 一 下 p 在 这 里 
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投 上 声 明 为 extern char 操 ; 向 包 版 先 的 定义 却 是 char pf10]; 这 种 情形 。 当 用 Bi 这 种 形式 提取 这 
个 志明 的 内 容 时 ， 实 陈 上 得 到 的 是 一 个 字符 。 但 按照 上 面 的 方法 ， 编 谋 颖 却 把 它 汉 成 是 个 

指针 , 拒 ACSIT 字符 解释 失地 址 显然 是 牛头 个 对 马 嘴 。 如 果 此 时 程序 当 挤 ， 你 应 该 额 于 称 庆 。 

人 百 则 的 话 ， 它 很 可 能 会 污染 程序 地 址 空间 的 内 容 ， 并 在 将 来 出 现 莫名 其 妙 的 错误 。 


4.4 使 声明 与 定义 相 匹 配 


指针 的 外 部 声明 与 数 红 定义 不 匹配 的 问题 很 赛 易 修 正 ， 只 要 修改 声明 ， 使 之 与 定义 机 号 
配 即 可 ， 如 下 所 不; 

文件 1: 

itrt mangollo0l]; 

文件 2: 

cxtern :nc margo[]; 

/* 引用 manga [i | 的 一 些 代 码 *y/ 

mango 数组 的 定义 分 配 了 100 个 int 的 空间 。 而 指针 定义 : 

int >*rais2ny 

则 申请 - -个 地 址 容纳 该 指针 。 指 针 的 名 宁 起 raisip， 它 可 以 指向 任何 - -个 int 变量 (或 int 
型 数组 )。 指 针 安 量 raisin 本 身 始终 位 于 同 :- 个 地 址 ， 得 它 的 内 容 在 任何 时 候 都 可 以 不 相同， 
指向 不 同 地 址 的 int 变量 。 撑 些 不 同 的 int 变量 可 以 有 不 同 的 值 。mango 数组 的 地 址 并 不 能 改 
变 ， 在 不 同 的 时 候 它 的 内 容 可 以 不 同 ， 但 它 总 是 表示 100 个 连续 的 内 存 空间 。 


4.5 数组 和 指针 的 其 他 区 别 


比较 数组 和 指针 的 另外 一 个 方法 就 是 对 比 两 者 的 特点 ， 砚 表 4-1 


表 4-1 数组 和 指针 的 区 别 







保 在 数据 的 地 址 
间接 访问 数据 ， 首 先 取得 指针 前 内 容 ， 把 它 作 | 直接 访问 数据 ，a[1] 只 是 简单 地 以 a-I 为 地 址 取得 数据 
为 地 址 、 然 后 从 这 个 地 址 提取 数据 。 

如 果 指 针 有 一 个 下 标 [H ， 就 把 少 针 的 内 容 加 
上 工作 为 地 址 ， 从 中 提取 数据 
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妹 表 
指针 数组 | 
通常 用 于 动态 数据 结构 。 通常 用 于 企 储 国 沁 数 日 导数 据 类 型 相同 的 元 表 。 
”和 美的 幅 数 为 mal loc 0，fzoe () 。 修 式 分 配 和 删除 
通常 指 内 匿名 数据 自身 采 为 数据 各 和 





数组 和 指针 都 可 以 在 它们 的 定义 中 用 字符 些 常 盟 进 行 初始 化 。 尽 管 看 上 去 - - 样 ， 底 居 的 
机 制 却 不 相同 。 

定义 指针 时 ， 编 详 器 并 不 为 指针 所 指向 的 对 象 分 本 空间 ， 它 只 是 分 瑟 指针 本 向 的 空 问 ， 
除非 在 定义 时 同时 赋 给 指针 一 个 字符 串 常量 进行 初始 化 。 例 如 ， 下 所 的 定义 创建 了 -一 个 字符 
串 常 屋 《〈 为 其 分 配 了 内 存 ); 

char *p = “breadfruit", 

注意 只 有 对 字符 中 常量 才 ' 是 如 此 。 不 能 指望 为 浮 点 数 之 类 的 常量 分 配 空间 ， 如 ; 

float *pip = 3.14]; 1* 错误 1 无 法 通过 编译 。 *; 

在 ANSI C 中 ， 初 始 化 指针 时 所 创建 的 字符 串 常 量 被 定义 为 只 该 。 如 果 试 菊 道 过 指针 修 
改 这 个 字符 串 的 值 ， 程 序 就 会 出 现 未 定义 的 行为 。 在 有 些 编译 器 中 ， 学 符 串 常量 被 存放 在 只 
允许 读 取 的 文本 段 中 ， 以 防止 它 被 修改 ， 

数组 也 可 以 用 字符 串 芝 量 进行 初始 化 ; 

char a[l] = “GoosebpeLzzy2” 

与 指针 相反 ， 由 学 符 吊 常量 初始 化 的 数组 是 可 以 修改 的 。 其 中 的 单个 字符 在 以 后 元 以 改 
变 ， 比 如 下 面 的 诸 人 名 ; 

SLrnCPY (la, “black”, 5); 


号 将 数组 的 值 收 改 为 “blackberry ”。 

第 9 章 讨 论 指 针 和 数组 可 以 等 同 的 情况 ， 并 讨论 了 为 什么 有 时 它们 可 以 相等 ， 上 中 的 机 
理 契 怎样 的 。 第 10 章 描 述 了 一 - 些 基于 指针 的 使 用 数组 的 高 级 技巧 。 如 果 能 坚持 读 完 那 一 音 ， 
那么 ， 关 于 数组 方 侧 的 知识 ， 仅 仅 是 你 访 掉 的 内 容 也 可 能 比 许多 C 程序 员 总 共 知 道 的 内 容 还 

指针 是 C 语言 中 最 淮 正 确 理 解 和 使 用 的 部 分 之 一 ， 可 能 只 有 声明 的 语法 比 它 史 烦 了 。 然 
而 ， 它 们 也 是 C 语言 中 最 谎 竖 的 部 分 之 -。 专业 C 程序 员 必 须 熟练 掌 担 malloc0 了 两 数 ， 并 且 
党 会 用 指针 操纵 匿名 内 在 。 
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4.6 轻松 一 下 一 一 国文 的 乐趣 


问 交 就 是 指 - -个 单词 或 短语 ， 其 顺 读 和 倒 读 前 是 一 - 样 约 。 例 灿 [: “do geese see God2” 加 
答 ;“O,no!'” )， Me -种 宝 内 娱乐 游戏 ， 每 个 人 争取 回答 出 最 长 淘 何 对 ， 辐 时 这 个 似 子 多 
外 有 后 划 总 。 例 如 至 做 仑 最 后 的 悔恨 之 语 “Able was 1], ere [saw Elba”， 汶 一 个 经 典 的 回 交 如 
是 开 沼 巴 拿 与 迹 河 的 个 人 英 雄 事迹 有 关 ， 文 休 话 是 “A man, aplan,actnal- 一 panaumal 


当然 , 不 由 能 由 -全 大 和 -个 计划 就 能 完成 巴 齐 切 迄 河 的 条 和 辫 ， 上 贾 其 - 梅 隆 大 党 的 一 位 
计算 机 科学 研究 生 jm Saxe 注意 到 了 这 一 点 。1983 年 10 月 ，Jim 亲 来 赤 聊 ， 便 开始 圾 卫 这 
人 条 巴 拿 巴 中文 ， 并 把 它 扩展 为 : 

A man, a plan, a cat, a cenal — Panama? 

Jim 比 这 何 话 族 相 其 他 斌 究 生 可 以 看 到 的 计算 机 系统 上 于是， 一 场 竞赛 开始 了 ! 

巾 鲁 大 学 的 Steve Smith 用 下 面 这 多 四 文 调 假 硬 这 种 修 诡 运河 的 努力 ; 

A tool,a fool, a pool—-loopaloofaloota! 

儿 个 星期 之 内 ，Guy Jazobson 把 出 拿 怠 回 文 扩展 为 ， 

A man, 4 plan, a cat, a ham, a yak, a yam, a hat, acanal 一 一 Panamal 

现在 ， 人 们 开始 对 这 个 纠 登 马 回 久 产生 了 浓厚 的 兴趣 ! 刚 毕 业 不 久 的 Dan Hoey 编写 了 
一 个 计算 机 程序 ， 搜 过 并 包 建 了 上 下面 这 个 奇观 : 

A man, a plan, a caret, 2. ban, a niyTidd, a svin, a Jac, a liar, a hoop, a pint, a catalpa, a gas, an 
01], a bird, a yell, a vat, a Caw, a pax, a wag, a tax, a nay, a ram, a cap, a yam, a gay, a tsar, a wall, a 
car, a luget, a ward, a bin, a v‘oman, a vassal, a wolf, a tuna, a nit, a pall, a fret, a watt. a bay, 4 daub. 
ad tan, a cab, a datum, a gall, a hat, h fag, a zap, a savy, a jaw, a lay, a wet, a gallop. a tug, a trot. a trap, 
a tram, a torr, a caper, a top, a tonk, a toll, a ball, f fair. a sax, a minim. a tenor, a bass, a passer, a 
capital, a rut, an amen, a ted, a cabal, a tang, a sun, an ass, 4 maw, a sag, a jam, a dam, a sub, a salt, 
an axon, a sall, an ad, a wadi. a radian, a room, a rood, a rip, a tad, a pariah, a revel, a reel, a reed. a 
pool, a plug. a pin, a peek, a parabola, a dog, a pat, a cud, a nu. a fan, a pal, a rum, a nod, an eta. a 
lag, an eel, a batik, a mug, a mot, a nap, a maxim, a mood, a leek, a grub, 4 gob, a gel, a drab. a 
citadel, a total, a cedar, a tap, a 2ag, a rat, a manor. a bar, a gal, a cola, a pap, a yaw, a tab, a raj, a 
gab, a nag, a panan, a bag, a iar, a bat, a way, a Papi a local, a gar, a baron, 4 mat, a rag, a gap, 2 tar, 
a decal, a tot, a led, a tic, a bird, a leg, a bog, a burg, a keel, a doom, a mix, a map, an atom, a gum, 
a kit, a baleen, a gala, 4 ten, 4 don, a mural, a pan, a faun, a ducat, a pagoda, a lob, a rap, a keep, a 
nikp, a gulp, a loop, a deer, a leer, a lever, a hair, a pad, 4 tapir, a door, a moor, an aid, a raid, a wad, 
an alias, an ox, an atlas, a bus, a madam ,a jag, a saw, a mass .an anus, a gnat, a lab, a cadet, an em, 
a natural, a tip, a caress, a piss, a baronet a minmax, a sari, a fall, a batiot a knot, a pot, a rep., a 
Carrot, a mart, a part, atort, agut, a poll, a gateway, a law, a jay, a sap, a zag, a fat, a hall, a gamut, a 
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dab, a can, a tabu, a day, a Datt, a Waterfall, a patina, a nut. a flow, 4 lass, a Van , a mow, a nib, a 
draw, a regular, a call, a war, a stay, a gam, a yap, a cam , a ray, an ax, a tag, 4 Wax, ia paw, a cat, a 
valley, a drib, a lion, a saga, a plat, a catnip, a pooh, a rail, a calamus, a dairyman, a bater, a canal-— 
—Panama. 

catatpa〔 你 可 能 止 在 疑 感 它 契 什么 意思 )〉 是 美 诸 ! 种 树 的 名 称 。 你 吓 以 自 岂 去 查 一 下 
axon 和 calamus 的 意思 .Dan 在 注释 中 说 叫 了 了 如果 对 搜索 算法 略 加 改进 ， 可 以 使 这 个 序列 再 
长 儿 倍 。 

这 个 搜索 算法 很 有 创造性 一 -Dan 编写 了 一 个 有 限 状态 机 ， 潮 试 一 串 不 完整 的 同文 ， 在 
每 种 情况 下 ，|9[ 文 路 不 到 配 的 部 分 组 成 -种 状态 。 从 最 初 的 加 文 出 发 ，Dan 注意 到 “a canal” 
中 的 “aca” 正 好 位 于 原先 那个 回 文 (A man,a plan, a can 引 一 一 Panama!) 的 中 间 ， 所 以 可 以 在 
“aplan” 的 后 般 增 加 适 党 的 短语 ， 前 提 是 它 的 反 序 正好 是 一 个 单词 或 单词 的 部 分 。 

怎样 在 “aplan” 后 面 : 负 入 新 的 单词 呢 ? 首先 搬入 :个 “aca"”， 这 样 就 形成 了 “aplan， 
acaacanal ”的 厚 列 ， 黄 果 “ca” 是 … 个 单词 就 大 功 告 成 ， 仙 时 在 还 没有 ， 所 以 查 增 加 几 
个 学 母 和 “ca” 放 在 一 起 ， 使 之 形成 -- 个 完整 的 单词 ， 然 后 人 疙 的 右边 增 吉 这 几 个 字 扣 的 反 
序 。 例 如， 共 在 “ca” 右 边 增加 了 “ret” 组 成 “caret”， 夫 人 么 就 要 让 “caret” 的 右边 加 | “ter”。 
人 每 次 揪 入 单词 时 ， 拒 所 增加 的 单词 多 余 的 几 个 字母 反 序 ， 作 为 所 池 找 的 下 个 章 亲 的 
开始 部 分 。 表 4-2 展示 了 六 个 过 程 ; 





表 4-2 创建 回 文 

状态 tf , 7 和 + 

六 “-aca”: A man, aplan, ... a canal, Panama 
状态 “ret-”: “aplan, a caret, ... a canal, Panama” 
状态 “-aba”， “.,, a plan, a caret, ... a hater, a canal. ...” 
状态 “n-”: *... a Caret, a ban, ...a bater, a canal,..” 
状态 “-adairyma”: "a caret, a ban, ... a dairyman, a bater, ...™ 
状态 “-a”: “aban, amyriad, ... a dairyman, a bater, ...” 


有 有 限 状 态 机 可 以 接受 的 状态 就 是 那些 末 匹 配 部 分 本 筷 就 是 回 文 。 换 名 话说 , 在 任何 时 候 ， 
人 任务 妹 宣 告 完成 。 任 这 个 例子 里 ， 最 后 … 次 插入 
之 前 的 状态 是 “... a nag, gen, …”， 在 中 问 考 入 “apa” 形 成 “...a nag, a pagan,.…”, 由 十 “apa” 
本 于 碌 是 回 文 ， 所 以 算法 就 加以 结束 。 

Dan 使 用 了 -个 只 包含 名 词 的 小 型 单词 列表 。 如 果 不 是 这 样 ， 就 会 得 到 一 大 囊 “a how, a 
running, a would, an expect, an and.…” 之 类 不 着 边际 的 短 诗 。 另 一 种 办 法 是 选择 真 让 的 在 线 词 
典 《 而 不 仅仅 是 单词 列表 )， 它 能 提示 哪些 单词 是 名 词 。 如 果 使 用 这 种 方法 ， 就 能 产生 -个 真 
正 E 型 的 回 文 。 但 Dan 认为 :“ 如 果 我 弄 出 1 万 个 单词 的 回 文 ， 我 不 知道 是 否 会 有 人 友 兴 真 
疯 读 它 。 我 喜欢 现在 的 这 个 ， 欠 为 作为 炫耀 的 资本 ， 这 些 已 经 足够 了 。 我 已 经 不 根 再 在 这 上 
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面 花 脑筋 了 。” 他 说 的 浅 错 ! 


编程 挑战 





编写 回 文 
试 试 你 的 才华 : 编写 -一 个 C 程序 ， 产 生 上 万 个 单词 的 回 文 ， 把 它 贴 到 Usenet 上 的 
Tec.arts.Startrek， 使 自己 名 撑 四 海 . 他 们 已 经 厌 储 了 讨论 Kirk 上 尉 的 中 闻名 字 ， 喜欢 看 到 一 些 











= 
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对 链接 的 思考 








Pall Mall Gazette 于 1889 年 3 月 11 日 描述 “托马斯 爱迪生 先生 最 近 两 晚 都 没 合 腿 ， 他 
在 他 的 留声机 里 发 现 了 一 个 ‘Bng” 。” 
一 一 闪 儿 筋 站 这 对 发 天 Be，18375 
先驱 的 Harvard Mark J[ 计算 机 系统 有 一 本 目 志 , 现 保 让 在 位 于 Smithsonian 的 美国 国家 历 
史 博 物 馆 。 上 日志 1947 年 9 月 9 日 的 记录 里 有 一 只 昆 忠 的 遗 嫉 ， 可 能 是 它 偶尔 飞 到 书页 中 ， 当 
书 合 上 时 被 夹 在 了 那里 ， 记 录 里 有 个 标签 ， 标 题 是 “Relay #70 Panel F ( 飞 蛾 ) in relay”， 
在 这 下 面 ， 记 录 了 这 么 一 身 话 “发 现 了 第 一 个 Bug 实例 ”。 
一 一 Crace Hoppéer RM Bug, 1947 
当 我 们 刚 开 始 编 程 时 ， 就 惊奇 地 发 现 要 让 程序 正确 运转 比 想象 的 要 难 . 我 们 不 得 不 使 用 
调试 技术 。 我 还 清楚 地 记得 那 一 刻 ， 从 那 时 开始 我 就 领 司 到， 从 我 自己 的 程序 里 寻找 错误 将 
成 为 我 生活 的 一 个 重要 组 成 部 分 。 





Maurice Wilkes WM Bue, 1949 
程序 测试 可 用 于 发 现 Bug， 从 来 不 曾 有 一 个 测试 天 发 现 Bug. 
一 一 Edgger W. Dijkstra 发 吏 Bug, 1972 
5.1 的 数 库 、 链 接 和 载 人 
一 开始 ， 让 我 们 回 岳 一 下 链接 器 (inker) 的 基础 知识 ， 编 译 器 创建 - -个 输出 文件 ， 这 个 广 
件 包 含 了 可 重 定 位 的 对 象 。 这 些 对 象 就 是 与 流程 序 对 应 的 数据 和 机 器 指令 。 本 章 所 使 用 的 实 
例 就 是 存在 于 所 有 SRY4 系统 中 的 复杂 链接 形式 。 
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链接 器 位 于 编译 过 程 的 哪 一 阶段 


绝 人 多 数 编 详 器 并 不 是 “个 单一 的 庞大 程序 ,它们 道 常 由 多 达 六 七 个 稍 小 的 程序 所 组 成 ， 
这 些 程 序 由 一 个 山 做 “编译 路 号 动 右 (compiler driver) 的 控制 程序 米 调用 。 这 些 可 以 方便 地 从 
编译 器 中 分 离 出 来 的 单独 秆 序 包括 : 也 处 理 器 (preprocessor)、 语法 各 语义 检查 由 (syntactic and 
semantic checkery、 代 们 生成 器 (code generator) 、 访 -编程 序 (assemblemy、 优 化 虎 (oPimizemD ， 链 
接 疾 dinpker)， 当 然 还 包括 一 个 调用 记 有 这 些 程序 并 向 各 个 程序 传递 正确 选项 的 最 动 占 程 邦 
(driver program) ( 购 图 5-1)， 优 化 器 几乎 可 以 加 在 上 述 所 有 阶段 的 后 而 。 六 前 的 SPARC 纲 详 
器 件 编 详 器 的 前 端 和 后 端 之 间 的 中 因 表 示 层 执行 绝 人 大 部 分 的 优化 措施 。 


CC 观 处 理 侣 


阶段 p 







前 淹 
(出 法 和 说 多 分 析 》 


后 疹 


《代码 生成 器 ) 


阶段 1 
图 5-1 ”编译 器 通常 分 割 成 儿 个 更 小 的 程序 


它们 之 所 以 分 成 儿 个 独立 的 程序 ， 是 因为 在 程序 中 如 果 全 个 具有 特定 功能 的 部 分 自身 都 
是 … 个 完整 的 程序 ， 就 会 更 容易 设计 和 维护 。 例 如 ， 控 制 顶 处 理 过 程 的 规则 是 预 处 理 阶 段 所 
独 有 的 ， 它 跟 C 语言 的 其 他 部 分 并 没 多 少 共同 之 处 。C 预 处 理 器 经 常 (但 并 不 总 是 ) 是 … 个 
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独立 的 程序 。 如 天 代码 生成 器 了 广 称 “后 端 ”》 被 总 写成 一 个 独立 的 程 序 ， 它 很 是 能 对 以 被 共 
他 语言 共 学 。 这 种 设计 方法 的 代价 是 运行 儿 个 筷 小 的 程序 比 运 行 一 个 大 型 程序 所 花费 的 时 间 
要 长 5 因为 存在 初始 化 进程 以 及 在 各 个 阶段 之 间 传 递 信 总 的 开销 ) 可 以 使 用 -# 选 项 仓 夏 编 详 
过 程 的 侣 个 独立 阶段 。-V 选项 能 提供 版 本 信息 。 

可 以 遂 过 给 编 详 器 驱动 器 个 特殊 的 -W 选项 bd cee sa 四 各 个 
阶段 传递 选项 信息 。“ 吏 ”后 而 跟 ， 个 字符 〈 担 雯 哪个 阶段 )， 一 个 过 号， 然后 就 是 具体 的 选 
项 。 代 家 各 个 阶段 的 字符 也 出 现在 图 5-1 中 。 

全体 交 交 
交 级 ， 行 沂 编 译 此 睫 动 器 这 个 选 坝 是 想 传 给 链接 器 ， 而 不 是 预 处 塌 器 或 编 详 跨 或 汇编 程序 戒 
其 他 编译 阶段 。 下 迎 这 条 命令 : 

CC -Hl, -m main.s > main,linker.map 

将 “-m” 选 项 传递 给 狂 接 - 载 入 器 ， 要 求 它 庆生 链接 器 映像 。 你 应 该 试 上 儿 次 ， 看 看 它 所 
产 牛 的 是 何 种 信息 。 

日 标 文 件 并 不 能 直接 执 行 , 它 首先 需要 载 入 到 链接 当中 。 链接 器 确认 main 明 数 为 初始 进 
入 所 【程序 开始 执行 的 地 方 》， 拒 符号 引用 (symbolic reterencej 绑 定 到 内 在 地 址 ， 把 所 有 的 月 
标 文 件 集 中 在 一 起 ， 吉 加 上 库 交 和 件 ， 从 而 产生 可 执行 文件 ， 

用 村 PC 的 链接 机 制 与 那些 De et on 川 ，PC 的 链接 器 一 - 般 
只 提供 儿 个 基本 的 IO 上 服 竺 ,就 吓 波 称 作 BIOS 的 程序 ， 它们 存在 杆 内存 中 国定 的 地 点 ， 并 
不 是 每 个 可 执行 文件 的 一 部 分 、 如 果 PC 杰 网 高 级 的 服务 ， 可 以 通过 库 前 
数 提供 ， 人 也 纳 诺 器 必须 把 库 范 数 链 接 到 每 个 可 执行 文件 中 。 存 MS-DOS 中 ， 没 有 办 法 排 断 出 
函数 库 对 其 中 几 个 程序 较为 常用 ， 从 而 只 在 PC .上 安装 一 次 。 

UNIX 系统 以 前 也 起 如 此 。 妆 链接 程序 时 ， 需 要 使 用 的 冬 个 库 函 数 的 - : 份 拷贝 被 如 入 色 
本 执行 文件 中 。 近 儿 年 ， 一 种 更 为 现代 和 优越 的 被 称 作 动态 链接 的 方法 逐渐 被 来 朋 。 动 态 链 
接 允 许 系 统 提供 一 个 庞大 的 函数 库 集 合 ， 可 以 提供 许多 有 用 的 服务 。 但 是， 程序 将 在 运行 时 
过 找 它 们 ， 抽 不 是 把 这 些 陆 数 库 的 一 进 制 代码 作为 自身 可 执行 文件 的 部 分 ,IBM 的 8/2 
操作 系统 具有 动态 链接 的 功能 ，Microsoft 新 型 谊 舰 级 Windows NT 操作 系统 也 具有 动态 链接 
荔 能 。 最 近 几 年 ，Microsoft 在 它 的 Windows 桌面 操作 系统 中 也 采用 了 动态 链 掖 . 

如 果 闵 数 库 的 一 份 拷贝 是 可 执行 文件 的 物理 组 成 部 分 ， 那 么 我 们 称 之 为 静态 链接 ， 如 果 
吉 执 行文 件 只 是 包含 了 文件 各 ， 让 载 入 器 在 运 行 时 能 够 寻找 程 序 所 需要 的 函数 库 ， 堵 么 我 们 
称 之 为 动态 链接 。 收 集 模 抉 准备 执行 的 三 个 阶段 的 规范 名 称 是 链接 -编辑 (link-editing)、 载 入 
(loading} 和 运行 时 链接 (runtime linking)。 蔡 态 链接 的 模块 被 链接 编辑 并 载 入 以 便 运 行 。 动 态 
链接 的 模块 被 链接 纳 辑 后 载 入 ， 并 在 运行 时 进行 链接 以 便 运 行 。 程 序 扶 行 时 ， 在 maing 函 数 
被 调用 前 ， 运 行 时 载 入 器 扫 其 学 的 数据 对 象 载 入 到 进程 的 地 址 空间 。 外 部 函数 被 真 止 调用 之 
有 前， 运行 时 载 入 器 并 不 解 本 它们。 所 以 即使 链接 了 函数 亩 ， 如 果 并 没有 实际 调用 ， 也 不 会 带 
来 额外 开销 。 这 两 种 链接 方法 在 图 5-2 中 作 了 比较 。 
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750 Kb 





1Kbyte 


5 Kb 
620 Kb 产生 


库 阴 数 在 运行 时 被 映射 到 进程 中 





注 ; 图 由 的 文件 大 本 议 用 于 说 导 的 日 的 ， 己 实际 情况 可 能 不 同 。 
图 5-2 静 沪 链接 与 动态 链接 
妇 全 是 在 静态 链接 中 ， 整 个 libc.a 文件 也 并 没有 被 全 部 装 入 人 包 可 执行 文件 中 ， 所 装 入 的 
只 是 所 入 更 的 抽 数 。 


5.2 ”动态 链接 的 优点 
动态 链接 是 一 种 更 为 现代 的 方法 ， 它 的 优点 是 避 执 行文 件 的 体积 可 以 非常 小 。 员 然 运 行 


速度 稍 慢 - - 些 , 但 动态 链接 能 够 更 加 有 效 地 利用 磁盘 窜 间 ,而 且 链 接 - 编 辑 阶段 的 时 间 也 会 纵 
短 (因为 链接 器 的 有 些 上 作 被 推迟 到 载 入 时 )。 





动态 链接 的 目的 之 一 是 ABI 


动态 链接 的 主要 目的 就 是 把 程序 与 它们 使 用 的 特定 的 通 数 库 版 本 中 分 离开 来 。 取 而 代 之 
的 是 ， 我 们 约定 由 系统 向 程序 提供 一 个 接口 ， 访 接口 保持 稳定 ， 不 随时 间 和 操作 系统 的 后 续 
版 本 发 生变 化 ， 

程序 可 以 调用 接口 所 承诺 的 服务 ， 而 不 必 担 心 这 些 功 能 是 怎样 提供 的 或 者 它们 的 底层 实 
现 是 否 政变 。 由 于 它 是 介 于 应 用 程序 和 函数 库 二 进 制 可 执行 文件 所 提供 的 服务 之 间 的 接口 ， 
所 以 称 它 为 应 用 程序 二 进 利 接口 (Application Binary Interface, ABT)。 
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统一 基于 AT&T 的 SVr4 的 UNIX 世界 的 目的 就 是 提供 一 个 单独 的 ABI、ABI 保证 函数 
库存 在 后 所 有 遵循 约定 的 贰 器 中 ， 并 保证 接口 的 完整 性 .动态 链接 必须 保证 4 个 特定 的 通 数 
库 : libe (C 运行 时 函数 库 ) 、libsys ( 其 他 系统 函 教 ) 、libX(X windowing) 和 libnsl ( 网络 服 
务 ) 。 其 他 的 函数 库 可 以 通过 静态 链接 ， 但 最 好 采用 动态 链接 ， 

过 去 ， 应 用 程序 销售 痪 在 每 次 新 版 本 的 操作 系统 或 函数 摩 出 现时 都 必须 重新 链接 他 们 的 
软件 。 这 带 来 了 巨大 的 额外 工作 量 ， 困 为 需要 照顾 许多 方方面面 。ABJ 就 不 需要 这 样 做 、 它 
保证 运作 良好 的 应 用 程序 不 会 受 同 祥 运 作 良好 的 底层 系统 软件 升级 的 影响 

尽管 单个 是 执行 交 件 的 启动 速度 梢 受 影响 ， 但 动态 链接 可 以 从 防 个 方 几 提高 性 能 : 

1. 动态 链接 吕 执 行文 件 比 功能 相同 的 静态 链接 可 执行 文件 的 体积 小 。 它 能 够 弛 省 爸 代 窒 
间 利 虚拟 内 存 ， 琴 为 图 数 库 只 有 企 需 监 时 才 被 且 射 到 进程 中 。 以 明 ， 各 匈 把 国 数 库 的 搁 贝 绑 
定 到 和 鲜 个 可 执行 文件 的 惟一 方法 就 起 把 服务 置 二 内核 汪 而 不 是 函数 这 中 ， 这 就 带 来 了 可 和 怕 的 
“内 核 膨胀 ”问题 。 

2. 所 有 动态 链接 到 某 个 特定 函数 库 的 可 执行 文件 企 运 行 时 共享 该 流 数 库 的 一 个 单独 找 
由 。 操 作 系统 内 核 保 让 暴 对 到 内 存 中 的 函数 库 果 以 被 所 有 使 用 它 科 的 枝 程 共享 。 这 号 提供 了 
更 好 的 IO 和 人 交换 室 间 利用 案 ， 节 省 了 物理 内 存 ， 从 而 提 贡 了 系统 的 整体 性 能 。 如 果 吕 执行 
多 件 起 静态 链接 的 ， 得 个 廊 件 者 将 拥有 一 份 滑 数 库 的 拷 页 ， 显 然 极为 浪费 ， 

例如 ， 如果 你 有 八 个 师 十 XViewTM 函 数 库 的 应 用 程序 止 在 运行 ， 只 洁 要 把 一 个 XView 上 
数 库 义 本 段 映 射 到 内 存 巾 。 第 一 个 进程 的 mmap 调用 将 使 内 核 把 共 学 对 象 映 射 到 内 存 中 其 
余 七 个 进程 的 mmap 调用 将 使 内 核 拒 已 经 映射 到 内 存 中 的 对 象 由 各 个 进程 上 共享， 这 八 介 进程 
的 每 一 个 都 将 共享 内 存 中 的 同一 份 XView 黄 数 库 找 贝 。 如 果 函 数 库 是 静态 链接 的 , 将 会 有 八 
份 函数 库 拷贝 映射 到 内 存 上 ， 这 将 消耗 更 多 的 物理 内 存 ， 引 起 更 多 的 换 页 。 

动态 链 楼 使 得 渭 数 库 的 版 本 升级 更 为 容易 。 新 的 消 数 库 可 以 随时 发 布 ， 只 此 安装 人 到 系 统 
中 ， 旧 的 程序 就 能 够 自动 获得 新 版 本 也 数 库 的 优点 而 无 宕 重新 链接 。 

最 后 〈 盟 然 并 不 常见 ， 但 仍 可 能 出 现 )， 泪 态 链接 允许 用 户 在 运行 时 选 拌 需 业 执行 的 
销 数 库 。 这 就 使 为 了 提高 运 度 或 提高 内 存 使 用 效率 或 包含 额外 的 测试 信息 而 创建 新 版 本 的 
歇 数 库 是 完全 可 能 的 , 用 户 可 以 根据 白 己 的 喜好 , 在 程序 执行 时 用 -个 库 交 件 取 代 另 … 个 
库 文件 。 

动态 链接 是 一 种 “just-in-time(JIT)” 链 接 ， 这 意味 着 程序 在 运行 时 必须 能 够 找到 它们 所 


溉 数 库 的 路 答 不 能 随意 移动 。 如 果 把 程序 链接 氏 juserlibilibthread.so 库 , 乾 么 就 不 能 把 该 的 数 
库 移 动 到 其 他 的 目 杂 ,除非 在 链接 器 中 进行 特别 说 明 。 宪 则 ， 当 程序 调用 该 函数 库 的 通 数 时 ， 


” 系统 调用 mmap() 把 文件 映射 急 进 磁 的 地 址 空间 中 。 这 样 ， 文 件 的 内 容 可 以 通过 读 取 和 连续 的 内 存 地 址 米 歇 得 。 当 文件 包含 可 执 
行文 件 的 指令 对， 这 种 方法 尤为 适宜 。 人 在 SYr4 系统 出 ， 文 件 系统 裤 当 作 虚 拟 内 存 系 统 的 一部分， 而 mmap 就 是 ,种 杷 文件 蚁 
射 到 肉 存 的 机 制 。 
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就 会 在 运行 .时 导致 大 败 ， 给 出 这 样 一 条 错 谈 信 和 县 

1 中 .BoO.1L: main: Eatzl: iibthread.so: canr't cper File: errno = 2 

当 在 一 台 机 器 工 编 详 完 程序 后 ， 把 它 拿 到 另 一 台 不 同 的 机 器 土 运行 时 ， 也 可 能 出 现 这 种 
情况 。 执 行程 序 的 机 器 必须 县 有 记 有 该 程序 逢 要 链接 的 函数 库 ， 而 且 这 些 函 数 库 必须 位 丁 在 
链接 器 中 所 说 明 的 日 录 。 半 杆 标 准 系 统 陆 数 库 击 言 ， 这 并 不 成 问题 。 

使 用 共 环 函数 库 的 主要 原因 就 是 获得 ABI 的 好 处 - 杂 的 软件 不 必 因 新 版 本 也 数 库 或 
操作 系统 的 发 布 而 重新 链接 。 附 带 的 一 个 好 处 是 ， 它 也 能 所 高 系统 的 总 体 性 能 

任何 人 都 可 以 创建 静态 或 动态 的 函数 库 。 只 需 简 单 地 编译 一 些 不 包含 main 盟 数 的 代码 ， 
并 把 编 详 所 生 的 .o 文件 用 正确 的 实用 工具 进行 处 理 一 一 如 果 丰 静态 库 ， 使 用 “ar”， 如 果 是 动 
态 库 ， 使 用 “ld”。 








只 使 用 动态 链接 


动态 链接 现在 是 运行 System VY release 4 UNIX 的 计算 机 所 采用 的 缺 省 设置 ， 从 作用 上 
看 ， 静 态 链接 现 已 过 时 ， 只 能 静 静 躺 在 一 边 睡 大 觉 ， 

使 用 静态 链接 的 最 大 危险 在 于 将 来 版 本 的 操作 系统 可 能 与 可 执行 文件 所 缚 定 的 系统 函 
数 库 不 兼容 。 de N 的 操作 系统 中 ， 当 把 程序 运行 于 版 本 N+1 的 
操作 系统 上 时 ， 它 可 能 会 立即 崩溃 ， 也 可 能 出 现 一 个 不 明显 的 错误 。 

eo 避 基 扩大 人 贡 人 
过 来 考虑 倒 还 比较 保险 一 点。 但 是 ， 如 果 应 用 程序 动态 链接 到 版 本 N 的 系统 咀 数 库 ， 当 它 运 
行 于 版 本 N+1 的 操作 系统 上 有 时 ， 它 就 会 正确 选取 N+1 版 本 的 系统 函数 库 。 相 反 ，、 静 态 链接 
的 应 用 程序 不 得 不 针对 每 个 新 版 本 的 操作 系统 进行 重新 生成 以 保证 能 够 运行 。 

而 且 ， 有 些 甬 数 库 {ww libaio.so, libdl.so, libsys.so, libsolv.so 以 及 librpcsvc,so 等 ) 只 能 以 
动态 链接 的 形式 使 用 。 如 采 在 应 用 程序 中 使 用 了 这 些 削 数 库 中 的 任何 一 个 ， 你 的 程序 就 必须 
使 用 动态 链接 。 最 好 的 策略 就 是 所 有 的 应 用 程序 都 使 用 动态 链接 ， 这 就 可 以 避免 可 能 产生 的 
问题 。 





静态 库 被 称 作 archive， 它 们 通过 ar《〈 用 于 archive 的 实用 J 内) 来 创建 和 更 新 。ar 工具 
的 名 字 取 得 不 太 好 ， 如 果 广 告 学 的 原理 也 适用 于 软件 的 话 ， 汗 么 它 应 该 起 -个 类 似 
glue_files together (把 文 信 烙 在 一 起 〉 的 名 宁 ， 或 十 脆 就 取 static_ jibrary_updater ( 兢 态 库 出 
新 器 )。 静 态 库 约定 在 它 信 的 文件 名 中 使 用 “.a” 的 扩展 名 。 我 在 这 里 没有 给 出 一 个 创建 静态 
库 的 例 了 ， 因 为 它们 现在 己 经 过 时 ， 我 并 不 想 鼓励 任何 人 停留 在 精神 世界 进行 交流 。 
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在 SVR3 中 ， 还 存在 -种 中 辣 性 质 的 链接 ， 介 二 静态 链接 利 动 态 链 接 乙 间 ， 称 为 “静态 
从 享 库 (static shared libraries)”。 在 生命 期 肉 ， 它 们 的 地 址 始终 固守 ， 这 样 它 科 就 可 以 直接 绑 
定 到 应 用 程序 中 ， 较 之 动态 链接 少 了 - - 层 中 间 环 节 。 但 男 -方面 ， 它 们 最 得 不 是 很 兴 活 ， 而 
且 希 要 操作 系统 提供 很 多 支持 因此， 以 后 不 再 讨论 它们 。 

动态 链接 床 由 链接 编 糙 闪 1d 创建 . 根据 约定 , 动态 库 的 文件 扩展 名 为 “so” 农 示 “shared 
object《〈 共 部 对 象 )” 一 一 年“ 个 链接 到 该 函数 库 的 程序 者 共享 它 的 同 一 份 斤 册 。 和 而 静态 链接 
划 相 反 ， 冬 个 对 象 部 拥有 一 份 该 隆 数 库 内 容 的 找 贝 ， 明 得 浪费 。 动 态 链 接 库 的 最 简单 撒 式 帅 
以 通过 硅 cc 命令 上 加 上 -GO 选项 米 创建 ， 如 下 所 示 : 

各 cat tomato.c 

my_lib tuncticnt) { printfit"library trorine called\rn"Y; } 


$$ er -oo libfruit.so -G tomato.,c 
然后 ， 就 可 以 利用 这 个 动态 链接 库 来 编写 程序 了 ， 并 有 旦 使 用 下 而 这 种 方法 与 图 数 库 进 行 
链接 : 


$% Cat test.c 
main() {1 my_lip function{(}; } 


和 PC test.e L/home/linden -a/home/linden -ifruitl 
$$ 已 .OU 
Jiorary routine cailed 


-LihomeNlinden 和 -Rhomelinden 选项 分 别 告诉 链接 器 住 链接 时 和 运行 时 从 哪个 1 杂志 
找 证 要 链接 的 函数 库 。 

你 很 可 能 还 想 使 用 编译 器 选项 -K pic 米 为 孙 数 库 阁 生 与 位 里 无 关 的 代码 。 与 位 置 无 类 的 
代码 表 水 用 这 种 方法 产生 的 代 倘 保证 对 于 任何 企 局 数据 的 访问 都 是 道 过 额外 的 间接 方法 完成 
的 。 这 使 它 很 容易 对 数据 进行 姜 新 定位 ， 只 要 简单 地 修改 全 太 偏 移 量 表 的 其 中 一 个 值 就 可 以 
了 。 头 似 地 ， 每 个 函数 调用 的 产生 就 像 症 道 过 过 程 链接 表 的 其 个 剖 接 地 址 所 产 生 的 一 样 。 这 
样 ， 文 本 可 以 很 容易 地 重新 定位 到 任何 地 方 ， 只 要 修改 一 上 偏 移 量 表 就 可 以 了 。 所 以 当代 三 
在 运行 守 被 映射 进来 村， 运行 时 链接 器 可 以 直接 把 它们 放 在 任 条 空闲 的 地 方 ， 庙 代码 本 身 并 
不 南 要 修改 。 

在 缺 省 情况 下， 编译 器 并 不 产生 与 位 置 无 关 的 代码 ， 因 为 额外 的 指针 解除 引用 操作 将 使 
程序 在 运行 时 稍稍 变 慢 。 然 而 ， 如 果 不 使 用 与 位 置 无 关 的 代码 ， 所 产 牛 的 代码 就 会 被 对 应 到 
办 定 的 地 址 ， 庆 对 于 可 执行 文件 米 说 确实 很 好 ， 但 对 于 共享 库 ， 速 度 却 要 慢 一 点 ， 因 为 现在 
每 个 全 局 引用 就 不 得 不 在 运行 时 通过 修改 页 面 安排 公国 定 的 位 畦 ， 这 就 使 得 页 面 励 法 共享 。 

运行 时 链接 器 总 能 够 安排 对 页 面 的 引用 。 但 是 ， 使 用 位 置 无 关 代 码 ， 任 务 被 极 大 地 简化 
了 。 当 然 需要 权衡 一 下 ， 位 置 无 关 代 但 与 由 运行 时 链接 器 安排 代码 相 比 ， 速 度 是 快 了 还 大 慢 
了 。 根 据 经验 ， 对 于 函数 库 应 该 始终 使 用 与 位 置 无 关 代 码 。 对 于 共 萤 库 ， 与 位 置 无 关 的 代 人 由 
显得 格外 有 几 ， 因 为 每 个 使 用 共享 库 的 进程 一 般 都 会 把 它 映 射 到 不 同 的 虚拟 地 址 〈 尽 管 共享 
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问 一 份 物理 拷贝)。 

个 相关 的 术 诸 是 “ 纯 代 码 (pure code)”。 纯 是 执行 文件 起 只 包含 代 公 (无 静态 或 初始 雍 
过 的 数据 ) 的 文件 。 它 之 所 以 称 为 “ 纯 ” 是 因为 它 不 必 进 行 修改 就 能 被 其 他 特定 的 进程 执行 ， 
它 从 堆栈 或 才 其 他 ( 韭 纯 ) 段 引 用 数据 ， 纯 代 妈 段 可 以 被 上 共识。 如 果 生 成 与 位 置 无 关 代 全 ( 意 
味 着 共享 )， 你 通常 也 希 彰 它 龙 纯 代码 。 


5.3 ”了 国 数 库 链接 的 5 个 特殊 秘密 


当 使 用 函数 库 时 ， 洁 要 掌 氛 5 个 基本 的 、 不 明显 的 约定 。 绝 大 多 数 C 语言 书籍 战 手册 对 
此 并 没有 作出 清楚 的 解释 。 这 可 能 是 因为 编程 语 汪 的 六 档 认 为 链接 起 操作 系统 的 一 部 分 。 但 
是 ， 设 计 拘 作 系 统 的 人 们 去 ] 认 为 链接 是 诸 言 的 -部 分 。 结 果 ， 除 非 直 链接 器 开发 队伍 的 人 参 
与 进来 ， 否 则 人 人 们 顶 多 也 就 偶尔 提 到 它 --. 站。 这 里 展 水 了 关于 UNIX 链接 的 真实 情况 : 

1. 动态 库 文件 的 扩展 各 是 “.so”， 而 静态 库 文件 的 扩展 名 是 “.a” 

控 监 约定 ， 所 有 动态 库 的 文件 名 的 形式 是 libname.so 可 能 在 名 学 中 如 入 版 本 号 )、 这 样 ， 
线程 消 数 库 使 被 称 作 libthrsad.so。 静 态 库 的 文件 名 形式 是 libname.a， 共 享 archive 的 交 件 名 
形式 是 libname.sa。 睦 享 arzhive 只 是 一 种 过 渡 形 式 ， 帮 助人 和 们 从 世态 库 转 灾 公 动态 库 ， 共 这 
archive 现在 世上 过 时 。 

2. 例如 ， 你 通过 -ithread 选项 ， 告 诉 编译 链接 到 libthread.so 

传 给 C 编译 器 的 命令 行 参数 里 并 没有 提 到 函数 库 的 完整 路 径 名 . 它 其 全 没有 提 到 在 国 数 
ee 编译 器 被 告知 根据 选项 -Iname 链接 到 相应 的 芯 数 库 ， 

数 库 的 名 字 古 linbname.so 一 一 换 名 话说 ,“1lib” 部 分 和 文件 的 扩展 各 被 省 掉 了 ， 介 存 前 上 
人 

3. 编译 器 期 望 在 确定 的 目录 找到 库 

这 里 ， 你 机 能 会 疑惑 ， 编 译 器 是 怎么 知道 该 征 什 么 日 录 寻 找 函 数 库 呢 ?就 像 存在 一 神 特 
妹 的 规则 用 于 售 找 头 文件 一 样 ， 编 译 器 也 自 有 办 法 米 寻 找 函 数 库 。 它 查看 一 些 特 妹 的 位 置 ， 
如 在 /asrlib 中 查找 六 数 库 。 例 如 ， 线 程 库 位 于 /uswliblibthread.so。 

编译 带 选 项 -Lpathname 告诉 链接 器 一 些 其 他 的 月 孙 ， 如 果 命 令 中 加 入 了 -1 选项 , 链 接 
错开 往 这 些 目 录 查 找 滑 数 库 。 系 统 中 存在 几 个 环境 变量 ，LD_LIBRARY_PATH 和 
LD_RUN_PATH, 也 是 用 于 悍 供 这 类 信息 。 出 于 安全 性 、 性 能 和 创建 /运行 独立 性 方 而 的 考虑 ， 
使 用 环境 变量 的 做 法 现在 已 经 不 提倡, 一 般 还 是 华 链接 时 使 用 -Lpathname 和 -Rpathname 选项 。 

4. 观察 头 文 件 ， 确 认 所 使 用 的 函数 库 

你 有 书 能 遇见 的 男 一 个 关键 问题 是 “我 怎么 知道 必须 链接 到 涉 些 阴 数 库 ?”” 答 案 正 如 
ObiWan Kenobi 在 Star Wars 所 清楚 表达 的 那样 《大意 ):“ 卢 克 ， 使 用 源码 1”， 妇 上 江枫 察 程序 
中 的 源 代码 ， 就 会 发 山 自 己 调用 了 一 些 自己 不 曾 实 现 的 黄 数 。 例 如 ， 如 果 程序 跟 三 角 有 关 ， 
可 能 会 调用 像 sin0 利 cosQ 这 样 的 函数 ， 它 们 可 以 在 math 哺 数 库 中 找到 。 文 档 中 显示 了 每 个 
溢 数 期 望 接收 的 正确 的 参数 类 型 ， 并 说 明 它 位 于 哪个 郑 数 库 ， 
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一 个 很 好 的 建议 就 是 可 以 观察 程序 所 使 诸 的 #include 指令 。 件 棱 序 中 所 包 介 的 每 个 头 文 
i 代表 一 个 必须 链接 的 库 。 这 个 建议 也 适用 于 C++。 这 里 出现 了 个 名 学 不 一 至 的 大 


癌 题 Re 文件 的 名 学 通常 并 不 与 它 所 对 应 的 函数 库 名 相似 。 韭 党 遗憾! 这 是 你 “不 得 不 知道 
的 ”C 语 攻 的 个 混乱 之 处 。 表 5-1 大 术 了 一 些 常见 的 例子 ， 
表 5-1 Solaris 2.x 下 的 库 约定 
#include 名 件 名 库 路 径 名 所 用 的 编译 蜗 选 需 

<mlath.h> tusr/lib/Nlibm.so -Im 

<math.h> fusrilibAlibm.a dn -lm 

<stdio.h> fusr/lib/libe.so 自动 链接 

“fusriopenwintinclude/X11.h™ Ausriopenwinilib/NibX11.s6 -TinsriopenwinAlib —IX1 1 

<thread.h> 如 srlibyiibthread.so “1thread 

<curses.h> tusrilib/libcurses.a lourses 

<sys/socket.h> tusrilibilibsocket. sn -130CXe- 


消 数 库 链接 所 存在 的 功 一 个 不 一 - 致 性 斌 是 六 数 库 所 包含 的 荣 个 函数 的 原型 可 能 与 其 他 类 
义 件 中 所 声明 的 函数 的 原型 一 样 。 例 如 ， 在 头 文 件 <string.h>、<stdio.h> 和 <time.h>! 中 声明 的 
所 数 通 第 是 在 同 个 库 libc.so 中 提供 。 如 果 你 不 信 ， 可 以 使 用 nm 工 共 程序 州 出 也 数 库 所 包 
念 的 冰 数 。 在 下 面 的 小 启发 栏 月 毕 我 将 详细 讨论 这 一 点 : 


EA wo TE aa vvnenn wear 人 ee 





DR vv NA BRR ma NN vvveceiorev dmavyvmevae 


怎样 在 函数 库 中 观察 一 个 符号 
如 果 在 链接 程序 时 遇 到 下 面 这 种 错误 : 


19: nderfined sylibol. 
_xOr_ refterence 
**x Error Code 2 
make: Fatal error: Command failed for target ‘prog’ 


它 提示 找 不 到 符号 KCI_reference 的 定义 。 这 里 有 一 种 方法 ， 可 以 通过 它 找到 需要 链接 的 
翌 。 基 本 的 想法 是 使 用 nrl 命令 在 fusrlib 的 每 个 函数 库 中 浏览 所 有 的 符号 ， 从 中 寻找 所 委 失 
的 符号 。 在 缺 省 情况 下 ， 链 接 器 会 在 /asrccsylib 和 /usrflib 中 查找 ， 你 也 应 该 从 这 两 个 地 方 着 
手 ， 如 果 在 那里 找 不 到 就 进一步 扩展 查找 范围 (如 sur/openwin/lib). 


$$ Ca /usr/lib 


99 


®% foreach 1 {lib?*) 

? echo $7 

? nm $i 1 gren xdr_rafrorce | grep -v UNDEF 

? and 

-ibc.sa 

工 bra:. .SC 

[249121 1 213028 | 196 1 FUNC | GLO3 10 | 8 | xdr_reference 
libposix4.so 


这 会 在 该 目 承 中 的 所 有 酋 数 库 上 运行 “nm” 痊 序 ， 它 显示 郊 数 库 中 已 知 的 符号 列表 。, 通 
过 grep 设 定 需要 搜索 的 符号 ， 并 过 滤 掉 标记 为 “UNDEF” 的 符号 ( 在 该 函数 库 中 有 引用 ， 
但 并 不 是 在 此 处 定义 ) ， 结 只 显 示 xdr_reference 位 于 libnsl 库 . 需要 在 编译 器 命令 行 的 末尾 
加 上 -lnsl。 


FMPARS EI NN TT SRA Mp TE OOO ye Te EO TN 4 Te RA 





5. 与 提取 动态 库 中 的 符号 相 比 ， 静 态 库 中 的 符号 提取 的 方法 限制 更 严 

最 后 ， 在 动态 链接 利 静 坊 链接 的 链接 语义 上 还 存在 … 个 额外 的 局 大 区 划 ， 它 经 常会 迷 感 
不 够 仔细 的 用 户 。archive〔 毅 态 库 ) 与 共享 对 象 〈 动 态 库 ) 的 动作 不 同 。 左 动态 链接 中 ， 所 
有 的 库 符 号 进入 输出 文件 的 虐 拟 地 址 空间 中 ， 记 有 的 符号 对 于 链接 在 :一 起 的 所 有 文件 都 站 可 
见 的 。 相 到 ， 对 于 静态 链接 ， 在 处 理 archive 时 ， 它 只 是 在 archive 中 [查找 哉 入 器 当时 所 知道 
的 林 完 义 符 号 。 

简 而 言 之 , 在 编 详 嚣 命令 行 中 各 个 静态 链接 库 出 现 的 顺序 是 非常 重要 的 ,链接 丹 会 被 “ 卫 
数 库 是 看 哪 里 提 到 的 ? ”“ 它 是 以 什么 次 序 出 现 的 ? ”之 类 的 问题 搞 得 于 忙 脚 乱 ， 因 为 符号 是 
通过 从 左 到 右 的 顺序 进行 解析 的 。 如 果 相 同 的 符号 厅 两 个 不 同 的 阴 数 库 中 有 不 加 的 定义 ， 表 
态 库 出 现 的 顺序 不 同 ， 其 结果 就 有 可 能 不 同 。 若 是 你 故意 如 此 ， 对 于 怎 伴 避 僻 这 种 做 法 可 能 
带 米 的 危险 ， 你 急 必 山 是 胸 行 成 和 性， 

如 果 在 自己 的 代 磺 之 前 直入 静态 库 ， 又 会 带 来 男 一 个 问题 。 因 为 此 时 肖 未 出 现 未 定义 的 
符 写 ， 所 以 它 不 会 从 两 数 库 中 提取 任何 符号 。 接 着 ， 污 昌 标 文件 被 链接 颖 丸 理 时 ， 洗 所 有 的 
对 蚁 数 库 的 引用 都 将 是 末 实 现 的 ! 虽然 自 UNIX 诞生 以 来 ， 情 况 一 下 就 是 这 样 ， 但 许多 人 对 
此 显然 没有 由 想 准 备 。 只 右 极 少数 的 命令 要 求 它 们 的 参数 以 某 个 特定 的 顺序 出 现 ， 一 电 摘 错 
顺序 ， 它 们 通常 表 接 发 出 错误 信息 。 所 有 的 新 手 在 明白 这 些 概念 之 前 对 链接 的 这 方面 问题 感 
到 困惑 不 已 、 而 一 世 有 明白 了 概念 ， 又 对 概念 本 向 感 到 轩 惑 。 

这 个 问题 最 常 出 现 于 当当 人 链接 math 库 的 时 候 。math 库 在 许多 测试 程序 和 应 几 程 序 中 
使 用 频 浆 非常 高 ， 所 以 我 们 纺 竟 力 提高 它 的 运行 时 性 能 ， 哪 怕 只 是 微 平 其 微 的 提 贞 。 结 果 ， 
libm 经 常 是 以 静态 链接 的 archive 形式 存在 。 如 果 你 的 程序 使 用 了 一 些 数学 函数 如 sin0) 等 ， 
若 像 下 面 这 样 进行 静态 链接 : 

ce -ln main.,c 


则 会 得 到 - -条 错误 信息 ， 如 下 : 
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UmQcfEineG first referenced 
symboel 1n file 
已 工 这 malin.o 


ld: iatai: Symbo. referencing errors. No ouiput written to a.out 

为 了 能 从 math 库 中 提取 所 需 的 符号 ， 首 先 需 要 让 交 伯 包含 木 解析 的 引用 ， 如 下 所 示 : 

ce main.c -im 

对 - 丁 不 够 仔细 的 人 ， 这 样 显然 会 带 来 尤 尽 的 迷 恼 。 和 拇 个 人 都 习惯 f 通 用 的 命令 形式 < 命 
邻 >< 选 项 >< 文 件 >， 所 以 让 链接 器 采用 < 命令 >< 文 件 >< 选 项 > 这 样 的 约定 是 很 容易 引起 混淆 
的 。 而 及 ， 它 会 平静 地 接受 第 - -种 形式 ， 却 给 出 错误 的 结果 ， 这 进 “ 步 增加 了 引起 混淆 的 可 
能 性 .SUN 的 编译 占 小 组 对 编 详 器 驱动 的 某 个 方 二 进行 了 改进 , 这 样 它们 就 能 处 理 这 种 情况 。 
我 们 修改 了 SunOS 4.x 中 的 独立 编译 器 驱动 ， 从 SC0.0 转 到 SC2.0.1， 这 样 ， 当 用 户 忽 略 了 -lm 
选项 时 ， 编 译 器 也 能 进行 志 确 的 处 理 。 但 是 ， 只 然 它 能 够 正确 执行 ， 但 毕竟 与 AT&T 的 做 法 
不 一 样 ， 从 而 破坏 了 与 System V Interface Definition (系统 5 界面 定义 ) 的 一 性 性 ， 所 以 我 们 
不 得 个 恢 复原 来 的 做 法 。 元 论 如 何 ， 从 SunOS 5.2 起 ， 我 们 提供 了 动态 链接 版 本 的 math 库 ， 
它 位 十 jusr/lib/libm.so。 





函数 库 选 项 应 置 于 何 处 
始终 将 -1 画 数 库 选 项 放 在 编译 命令 行 的 最 右边 ， 


在 PC 上 , 当 Borland 的 编译 器 驱动 器 试图 猜测 需要 链接 的 浮 点 库 时 , 也 会 出 规 类 似 的 问 
题 。 不 辛 的 是 ， 它 们 有 时 会 猜测 错误 ， 从 而 导致 下 面 的 错误 ， 


scanf : floating Poinr formats rot linked 


Abnormal program terminationfscant: 浮 点 格式 未 链接 ， 程 序 异 常 中 止 ) 

当 程 序 在 scanf0 〇 或 priatf0 中 使 用 浮 点 数 格 式 ， 但 并 不 调用 任何 其 他 浮 点 数 函 数 时 ， 就 有 
可 能 猜测 错误 。 工 作 区 可 以 在 将 被 载 入 链接 器 的 模块 里 声明 像 下 而 这 样 的 阔 数 ， 从 而 向 链接 
硕 提 供 更 多 的 线索 ; 


static void forcef-oat (float *p) 
上 tloat £f =.*pr Sorcefloat TEA } 


不 旧 实 际 调用 这 个 图 数 ， 只 要 保证 它 被 链接 即 可 。 这 样 就 能 给 Borland PC 的 链接 器 提供 
个 是 够 村 靠 的 线索 ， 即 该 浮 点 库 确实 是 需要 的 。 
男 外 还 有 -条 类 似 的 信息 , 当 软 件 需 要 数值 协 处 理 器 而 计算 机 却 未 安装 它 时 , Microsoft C 
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运行 时 系统 会 打印 出 一 条 信息 ,表示 “ 泽 点 数 卡 载 入 ”可 以 使 用 浮 点 数 仿真 诛 鹿 新 链接 程序 
来 解决 这 个 问题 


5.4 ”党 惕 Interpositioning 


Interpositioning ( 有 些 八 称 它 为 “interposing”) 束 弟 通过 编写 与 涯 状 数 癌 名 的 函数 米 取 代 
咏 库 遇 数 的 行为 。 这 古 再 ! 上 只 有 峙 些 喜 欢 和 在 没有 安全 网 的 快车 道 沿边 疾 行 的 人 才能 学 党 的 技 
瑟 。 它 吕 以 使 库 场 数 备 特定 的 程序 中 被 同名 的 用 记 | 通 第 是 咱 丁 调试 域 为 了 提 阐 
八 率 ， 但是， 用 像 使 用 一 把 没 右 保险 栓 的 于 枪 一样， 所 家 可 以 央 此 装 得 更 快 的 速度 ， 但 新手 
在 使 用 中 却 极 易 伤 宕 冉 已 。 

使 用 Interpositioning 需 旧 格外 小 心 。 很 容 易 发 生 自 己 代 码 中 某 个 符 寻 的 定义 取代 半数 库 
目的 相同 符 妨 的 意外 。 不 仅 你 白 己 所 进行 的 所 在 对 该 库 隙 数 的 调用 将 被 日 己 版 本 的 月 数 调用 
所 起 代 ， 而 且 所 有 调用 该 库 函 数 的 系统 调用 也 将 用 你 的 消 数 取 击 代 之 。 当 编 详 器 注意 划 亩 也 
数 趣 另外 一 个 定义 窗 蜂 时 ， 它 通常 不 会 给 出 错误 信息 。 这 也 足 尊 循 C 语言 的 设计 哲学 ， 邮 程 
序 员 所 做 的 部 起 对 的 。 在 这 早 ， 编 详 器 也 认为 这 是 程序 员 的 意图 。 

lnterpositioning; 和 缺 省 全 局 域 


1 没有 Tnrerpositiorirg， 阅 几 系 统 mktempt) 喇 数 
用 岂 程序 C 应 朋 数 


Mrempi!l 1 .1 


nmKEE:T2 


COELwa11y SCtwcG 1 oo krip i, . } 





2， 使 用 Interpositionin3 语 ， 系 统 版 本 的 mtetmp() 亏 数 被 自己 虐 本 的 问 名 晒 数 记 取代 ， 不 管 足 在 
日 己 的 代码 中 还 是 千 系统 调用 中 ! 


mmKLeTET { .,. } mktemp{t)y 1 ..,. | 





向 5-3 ”Interpositioning 和 [ 缺 省 全 局 成 术 意 图 
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多 生来 ， 我 们 尚 没有 见 蚀 令 人 信服 的 例 握 ， 证 明基 种 徐 果 只 能 通过 Interpositioning 有 效 
地 实 矶 ， 而 碟 法 用 其 他 方法 (或许 麻烦 一些 ) 米 完 成 :我们 曾 见 到 过 许多 例子 ，- 一 个 伴随 
Interpositioning 的 缺 省 全 启 域 的 符号 导致 难以 寻找 的 Bug 见 图 5-3), 我 们 多 到 过 十 儿 个 Bug 
报告 和 重大 软件 问题 ， 有 些 其 至 出 白 学 识 渊 博 的 软件 天 发 人 员 之 于 。 令 人 不 快 移 是， 
Interpositioning 本 于 并 不 是 Bug， 它 起 编译 器 明确 此 求 支 拉 的 。 
绝 大 多 数 程序 员 邦 没 认 件 CC 栋 准 库 由 的 所 有 函数 的 和 名字 ， 而 用 像 index 或 mktemp 这 样 
昔 饥 的 名 字 其 重复 概 滨 之 瞳 令 人 屹 和 售 。 有 时 候 ， 这 方 抽 的 Bug 会 带 入 人 包产 品 代 伍 中 去 。 


TNT A A rs 


软件 信条 








SunOS 中 跟 Interpositioning 有 关 的 一 个 Bug 








mt NM NN A 


在 SunOS 4.0.3 下 ， 打 印 程序 /usrucbylpr 有 时 会 产生 一 条 错误 信息 ， 表 示 “内 存 不 足 ” 
OO ee tg ee se 
这 是 一 个 无 意 产 生 的 InterFositioning 导致 的 Bug。 

编号 lpr 的 那个 程序 员 在 实现 jpr 时 创建 了 一 个 缺 省 情况 下 为 全 局 的 品 数 mktempf), 它 要 
求 接受 三 个 参数 .那个 程序 员 并 不 知道 在 C 函数 库 ([ANSI 之前) 中 已 经 存在 一 个 名 做 mktemp() 
的 闷 数 ， 它 的 功能 相似 ， 但 只 接受 一 个 参数 

不 素 的 是 ，lpr 也 调用 库 涵 数 getwd()， 而 后 者 在 内 部 需要 使 用 库 函 教 版 本 的 mktemp。 事 
实 上 ， 它 所 使 用 的 是 lpr 的 版 本 ! 这 样 ， 当 getwd0) 调 用 mktemp 时 ， 它 把 一 个 参数 放 到 堆栈 
中 。 但是，]pr 版 本 的 mktemp 却 提取 三 个 参数 ， 其 中 两 个 参数 的 内 容 显 然 是 垃圾 。 根据 垃圾 
内 容 的 不 同 ， 有 时 lpr 会 因为 “内 存 不 足 ” 而 失败 。 

准则 : 不 要 让 程序 中 的 任何 符号 成 为 全 局 的 ， 除 非 有 意 把 它们 作为 程序 的 接口 之 一 . 

通过 把 lpr 的 mktemp 邓 数 声明 为 static 函数 ， 使 它 在 所 在 文件 之 外 不 可 见 (也 可 访 维 它 
另外 取 一 个 名 字 ) ， 问 题 得 到 了 修正 。 mktemp 现在 已 被 ANSIC 标准 岩 函 数 tmpnam 所 取代 ， 
然而 Interpositioning 造成 问 题 的 机 会 依然 存在 。 
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衣 5-2 所 列 出 的 标识 符 不 应 该 出 现在 自己 程序 的 声明 中 。 它 们 中 的 有 些 是 始终 保留 的 ， 
其 他 一 些 则 共有 在 包含 一 个 特定 的 头 文件 后 才 是 保留 的 。 它 们 中 的 丰 些 具 在 全 局 范 赎 内 才 是 
保留 的 ， 其 他 一 些 则 无 论 在 全 局 范围 还 是 在 文件 范围 内 屠 予 以 保留。 同时 要 注意 所 有 的 关键 
子 邦 是 保留 的 ， 但 为 了 简单 起 见 并 未 在 表 中 列 出 。 避 人 免 床 烦 明 容易 的 方法 就 是 认为 这 些 标 识 
符 始终 属于 系统 所 有 ， 不 下 它们 用 作 和 白 己 移 标 识 符 。 

有 儿 项 看 上 去 像 这 样 : is[a-z] anything。 

这 表示 任意 以 “is” 开 头 , 所 面 跟 一 个 从 a-z 的 小 汉字 组 (但 木 包 括 诸如 数字 之 类 的 东 可 )， 
然后 册 接 任意 字符 。 
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翅 外 有 几 项 看 上 去 像 这 样 : acos, -f, -1. 


它 表 示 二 个 标识 符 acos acosf, acosl 都 是 保留 的 。 记 有 和 位 于 math 汰 文件 内 的 消 数 都 有 
个 接 党 一 个 double 参数 的 基本 版 本 。 那 里 也 可 能 有 两 个 阁 外 的 版 本 : 基本 名 后 加 后 组 1 赤 泵 
该 明 数 接受 个 long double 参数 ， 基 本 名 后 加 后 统 f 表 泵 该 函数 接 泛 一 个 float 参数 。 


六 5-2 


诞 免 使 用 的 标识 符 {在 ANSIC 被 系统 保留 ) 


本 划 在 标识 符 中 使 用 这 些 名 字 


.ything 


arexicr 
Diearch 
CHAR .3T7°T 
clock 

cosn, “EE, 1 


CBU_EDS] LON 


ferror 

Fgets 

DEG 
FULT_MAX .1 _ EXP 
PL'T_MIN. EXP 
ropen 

fypyutc 


free 


104 


abs 

ngort 

4lGl 

BUFSIe 
OIAF_MAL 

Ee 
Se 
DRL_MANT ID 
D3SL_ PIH 

del Iniad 


Fk[0-$1 


£flush 
FIs 

FI MAX_EXP 
WLT_MAX_EXP 
FI.T_RADIX 
FOPOPN_MAX 
fpu-s 


freayer 


下 
SAN 一 上 二 二 
RS 


Cp MIN 
COTKS_ PL SE 
CUr=eTICY_S3YTICED- 
DEBE-,_ MA 

Da- MIN_]N EY: 
Aiff ime 


E.RB-21aliyLliiry 


EXZT_2ATLURY 


[ciose 


£gctec 
FILENAME MAX 
ELT_MANT_DIS 
Fl _MIN 
FLT_ROUNTDS 
ipos_t 
frac_digits 


frexw, -f, -i 


ET 
AA ,sh 3 


atcl 


Ta 
COs, hs 
BEL .DIS 


SB MAR_ YXR 


CB MIW_FXPE 


div 


FIT_MIN_ILIO_EXD 
fmod, -1, -i 
fprirntLf 

fread 


[seanf 


不 要 在 标识 符 中 使 用 这 些 名 学 


fseek 


gle 


gm-1ime 

iit_tfrac digits 
Jnr_ ouf 

lieony 

TMDRT.. MAX 


LDEL_MIN :0_RnxXP 


LOgLVU, -£, -1 
maAlioc 
mbstowca 
mAf, -£, 1 
N_Cs. DeceGes 


negative_sigr 


Oitsectorf 


Der ror 


BLEULDEL... 


Canf 
SEEK_END 
set.locale 


STIS_|A-21anyching 


[EA 


可 E 二 .13T 


GTCGUI3PC 


Li 


LoBL_ .DIE 


UDRT, MAX_10_Exb 


LDB, MN_3XP 


lOca.ECornY 


LONC_MRYX 


MB_CUR_MRAX 


rmbt eve 


man. rlaci: mal_poirt 


TSEFE:_ PyY_space 


NULP- 


Pp_ca_prevedes 
poOsSitive_sign 
pulc 

raise 

remove 
SCHAR_MAX 
SETYK_SF2 
setvbuf 


S19g_a-omic_t 





ftel]l 


et.enyv 


NvGE_ VS1: 
INT_MIK 

iabs 

DDB,_ EDSTLON 
TPR3T .MARX_ZX2 
ldexp, 工 ， 
DCaltime 
LNG_M 
HME_LEN_MAX 
Mer .ad-2Z | anytnins 
TonNn_groupi:2u 


Ti_S1ign_pnsn 


p_sen_by_space 
pow, -f, 

Fut car 

rang 

renane 
SCHAR_MIN 
Sethuf 

SHR'M MAX 


S10 _2PL 





第 5 章 ”对 链接 的 思 
统 直 


i ourr ayrnkbo ， 


1a-zZ1lanytiirndy 


LDRBL. MENT DIO 
DB YIN 

ldiw 

log, -2E, 21 
pl 

mhlen 

MkL Im 
mon_hnousands_ ec 


NDsECS 


Pp .igi _pour: 


Printf 


Buts 


RAN MAR 


rewil “dl 


set. jr 


SHRT_MTN 


3STG_RRR 
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ST 1SN 


SIs-lL 


SlmRM 


Drints 


Srar:i 


StaAnit. 


Lerh;. -Fs: 


tm 


LM mirl 


CM Ydsy 


CMPnNam 


(TON FHEX 


¥Aa_eng 


vprint.f 


Wer L omDs 


不 里 在 标识 符 中 使 用 这 些 名 尝 


3IG[、 Zlanvyiliing 


STcLY™ 


三 六 上 | 
Aut, -f 1 
号 人 BC 六 


strls- .anythindy 


Lhcu3ancs_aep 


ET 


下 ZI1 


直人 


tola-z. anything 


UNgete 


va_liast. 


vsErin'.T 


weato rb 





1 naz 


TMD MAX 


UOHAR_MAX 


USRRT_MAY 


va_start 


wehar_l. 








oTile 


UTNT Mi 


rg 


记 住 ，ANSIC 标准 第 6.1.2 节 《 标 诉 符 ) 规定 ， 对 十 外 部 的 标识 符 ， 编 译 只 可 以 白 行 定 
义 ， 使 它们 不 区 分 字 村 大 小 字 。 同 时 , 外 部 标识 符 的 前 六 个 字符 必须 与 其 他 标识 符 不 同 (ANS1 
C 标准 第 5.2.4.1 节 ， 编 译 取 制 )。 在 这 两 种 情况 下 ， 湖 要 避免 使 用 的 标识 符 数 量 进 一 步 增加 。 
上 面 的 列 麦 包括 了 可 能 无 法 重新 定义 的 C 函数 库 符号 。 对 于 所 链接 的 此 他 函数 库 ， 也 会 有 一 
此 需要 避免 使 用 的 符号 。 你 应 该 伍 看 AB1 文档 !， 看 看 有 哪些 标识 符 需 要 避免 。 

ANSIC 标准 关于 有 学 空间 污染 的 问题 只 提 到 了 -部 分 . 在 第 7.1.2.1 节 中 ，ANSIC 纵容 
肯 户 建 无 尽 刁 地 重新 幢 义 系统 的 名 字 (有 效 地 助长 了 Interpositioning ): 

7.1.2.1 保 留 的 标识 罕 : 所 有 外 部 链接 的 标识 符 在 任何 下 列 部 分 中 [ 接 下 来 是 一 些 定义 标 
准 库 函 数 的 内 容 ].. . 始终 作为 保留 ， 不 能 在 外 部 链接 中 作为 用 户 的 标识 符 ， 


”The System V Application Binary Interface, AT&T, 1990 
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如 果 标 识 符 是 被 保留 的 ， 就 表示 用户 不 能 重新 定义 它 。 然 而 ， 这 并 不 是 一个 约束 条 件 ， 
汉 这 种 情况 发 生 时 ， 它 并 不 要 求 纺 详 器 给 出 错误 信息 。 它 只 不 造成 一 些 不 囊 移 村 问题 或 出 现 
林 定 义 的 行为 ， 换 名 话说， 如果 一 个 冰 数 的 名 字 问 C 靖 数 库 里 的 某 个 责 数 名 字样 (有意 战 
无 意 )， 就 创建 了 “个 不 遵循 杯 准 的 程序 ,但 编译 器 并 不 一 定 会 莹 条 这 种 行为 。 我 们 更 主意 标 
准 规定 编译 器 对 这 种 情况 能 给 出 一 条 警告 信息 ， 并 证 它 日 己 定 义 是 否 允 许 这 种 行为 。 就 像 人 
switch 诸 凶 中 ， 标 准 也 只 起 规 定 了 编译 恬 至 少 应 该 介 诗 的 case 标签 数 明 的 上 下限 (257 个 }, 它 
的 上 限 则 是 由 编译 并 日 二 定义 的 。 


5.5 ”产生 链接 器 报告 文件 


可 以 在 ld 程序 中 使 用 “-m” 选 项 ， 让 链接 器 产生 个 报告 。 它 里 面包 据 了 被 Interpose 
的 符号 的 说 明 。 道 常 ， 带 “-m” 选 项 的 14 会 产生 个 内 存 喘 射 或 列表 ， 显 示 在 可 执行 交 件 中 
的 什么 地 方 放 入 了 哪些 符号 。 它 同时 最 示 了 同一 个 符号 的 多 个 实例 ， 遂 过 查看 报告 的 内 容 ， 
用 户 可 以 判断 是 省 发 竺 了 Interpositioning。 

ld 程序 中 的 “-D” 选 项 是 随 SunOS 5.3 引入 的 ， 晶 的 是 提供 更 好 的 链接 -编辑 调试 。 这 个 
选项 (在 链接 器 和 际 数 库 和 王 册 中 右 话 细 说 明 ) 允许 让 六 显示 链接 -编辑 过 程 和 所 包含 的 输入 文 
件 。 如 果 需 要 监视 从 archive 中 提 旋 对 彰 的 过 得 ， 这 个 选项 尤其 有 用 。 它 同时 可 用 于 姑 术 运行 
时 绑 定 信息 。 

ld 是 一 个 复杂 的 程序 , 还 有 很 多 其 他 选项 和 约定 未 在 此 处 说 明 。 对 十 绝 大 多 数 应 川 米 说 ， 
这 些 说 时 已 经 足够 了 。 如 崩 知 道 更 多 有 关 它 的 知识 ， 下 面 提供 了 四 条 途径 ， 按 其 复杂 程度 分 
列 如 小 : 

*” 使 用 ldd 命令 ， 列 出 可 执行 文件 的 动态 依赖 集 。 这 条 命令 会 告诉 你 动态 链接 的 程序 所 
骨 台 的 函数 库 ， 

， ld 程序 的 -Dhelp 选项 能 提供 一 些 信 息 ， 有 助 于 查找 链接 过 程 中 出 现 的 问题 。 

， 查看 ld 程序 的 在 线 文 档 。 

。 贺 读 SunOs Linker and Libraries Manaal (位 于 801-2869-10 部 分 )。 

综合 利用 上 面 几 种 途 符 ， 可 以 知道 所 瑚 要 的 任何 微妙 的 特殊 链接 效果 。 


ot 一 
{1 
~ + 


-小 启发 








“botch” 何 时 出 现 


在 Sun0S 4.x 中 ， 如 果 在 一 条 错误 信息 于 出 现 了 “botch (修补 ) ”这 个 词 ， 表 示 载 入 
器 发 现 了 一 个 内 部 的 不 一 私 性 问题 。 这 通常 归 因 于 不 正确 的 输入 文件 。 
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在 Sun0S 5.X 中 ， 载 入 器 在 检查 输入 、 维 护 正确 性 和 一 致 性 方面 有 了 很 大 的 提高 。 它 不 
再 需要 抱 想 内 部 错误 ， 因 此 “botch” 信 息 不 再 存在 


DID DDD Dn DDE DA DD 





5.6 ”轻松 一 下 一 一 看 看 谁 在 说 话 : 挑战 Turing 测验 


件 电 子叶 代 的 黎明 ， 计 算 机 的 潜力 逐渐 显 山 露水 ， 人们 开始 争论 哪个 系统 有 有 昌 -1 将 只 
备 估 上 智能 。 这 很 快 归 结 为 一 个 问题 “我 们 怎样 知道 机 器 在 想 些 什么 ? ”在 1950 个 Mind 期 
天 的 一 篇 论文 中 ， 芮 国 数字 家 Alan Turing 设计 了 个 实际 测验 ,把 大 们 从 理念 上 的 叭 叭 不 体 
中 解脱 出 米 。Turing 提议 电位 讯问 者 与 另 一 个 人 和 站 计算 机 谈话 《通过 电 传 形式 ， 以 避 
免 视觉 利 声 觉 线索 )。 刀 果 在 5 分钟 肉 ,讯问 者 无 法 分 辨 出 哪个 是 人 哪个 是 计算 机 ， 邢 么 这 台 
计算 机 使 被 认为 是 具有 人 .和 党 能 。 这 个 游戏 被 称 为 Turing 测验 ， 

从 Turing 提议 这 个 济 给 后 的 数 生年 里 ，Turing 测验 己 经 进行 过 多 次 ， 有 时 出 现 了 一 些 今 
人 人 革 腔 口 条 的 结 玉 。 我 们 揪 述 了 其 中 一 些 测试 ， 并 庙 现 了 一 些 对 话 情 织 ， 你 可 以 自行 判断 。 


5.6.1 Eliza 


“Eliza” 古 最 早 用 于 处 : 池 自 然 语言 的 程序 之 …， 它 的 名 宁 取 自 萧 伯 纳 章 本 Pygmalion 中 馈 
下 的 女 永 人 公 。Eliza 软件 是 由 MIT 的 一 名 教授 Joseph Weizenbaum 于 1965 年 编写 ， 它 模仿 
患者 对 精 坤 病 学 家 Rogerian 所 作 询 问 的 回答 。 该 程序 对 输入 的 文字 进行 表 而 的 分 析 ， 并 从 -- 
堆 内 置 于 牌 序 中 的 问答 中 损 一 个 合适 的 了 以 返回 。 从 表 上 直上 看 ， 计 算 机 好 像 能 理解 所 有 的 谈 
话 ， 这 个 纠 觉 愚弄 了 相当 -部 分 对 计算 机 不 知 底细 的 人 们 。 

Weizenbaum 表 先 邀请 他 的 秘书 来 测试 这 个 系统 ， 从 而 揭 开 了 这 个 现 旬 的 冰 1- 角 。 在 与 
Eliza 综 过 几 分 钟 的 打 全 交谈 后 ， 这 个 秘书 (她 在 先前 的 才 个 月 里 一 上 看 着 Weizenbaum 编写 
这 个 软件 ， 应 该 比 绝 大 多 数 人 更 清楚 这 只 不 过 是 -个 计算 机 程序 ) 要 求 Weizenbaum 离开 羽 
间 ， 这 样 她 便 可 以 与 对 方 私下 交谈 。 

Turing 测验 的 第 一 次 测试 是 失败 的 ， 虽 然 那个 秘书 拒 这 个 初级 软件 ( 它 在 人 工 智能 方面 
并 没有 投入 多 大 努力 ) 当成 了 人 ， 但 与 其 说 它 显 示 子 软件 的 智能 ， 还 不 如 说 它 显 示 了 大 区 的 
易 受 骗 性 。Eliza 成 了 一 个 流行 的 程序 ， 并 被 一 个 波 上 上 上 顿 计 算 机 顾问 机 构 Bolt Berenek and 
Newman 记 米 用 。 当 BBN 的 一 位 副 主 席 在 测试 中 也 发 现 白 己 受 骗 二 当 后 ， 人们 对 它 进 行 了 多 
次 更 为 泪 格 的 测试 。 


5.6.2 Eliza 面 对 副 总 裁 


计算 机 科学 家 Daniel Bobrow 和 SIGART Newsletter1968 年 12 月 的 栏目 中 作 了 以 下 描述 。 


一 个 星期 六 的 早上 , 大约 9 点 钟 ，BBN 一 名 负责 销售 Telcomp 通信 服务 的 副 总 载 来 到 我 
们 的 计 尊 机 室 ， 和 希望 能 用 计算 机 作 些 演示 。 他 在 电 传 上 发 现 了 一 张 纸 条 ， 上 面 写 着 “把 所 有 
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的 信息 输入 电 传 ， 最 后 加 个 向 号 ，” 这 张 纸 条 是 一 位 关 违 到 这 时 的 程序 员 留 下 的， 他 刚刚 成 
功 地 进行 了 Lisp 版 Doctcr 程序 【基于 Weizenbaum 开发 的 Eliza ) 的 运行 。 但 是 ， 副 总 裁 先 
生 却 以 为 这 张 纸 条 暗示 这 个 电 传 是 与 我 家 里 的 计算 机 连接 在 一 起 的 ，、 因 为 我 经 常 整 夜 开 着 计 
算 机 、 因 此 ， 和 他 开始 用 电 传 与 “我 ”交谈 ， 但 事实 上 是 与 Doctor 程序 交谈 ， 于 是 就 有 了 下 面 
的 谈话 ， 

副 总 裁 : 你 认为 今天 早上 我 可 以 使 用 这 台 计 算 机 吗 ? 

电 传 : 你 为 什么 要 问 这 个 问题 ? 

副 总 裁 : 也 许 我 可 以 多 销售 一 些 telcomp. 

电 传 : 你 为 什么 不 确信 ? 

副 总 载 : 我 预期 的 用 户 从 没 见 过 这 个 系统 的 演示 ， 

电 和 传 : 这 对 你 很 重要 吗 ? 

副 总 裁 : 当然 。 

电 传 : 你 对 这 件 事 很 积极 啊 。 

副 总 载 : 这 很 芒 廖 。 

电 传 : 你 说 它 荒 雇 是 什么 意思 ? 

副 总 裁 : 到 底 有 什么 理由 不 让 我 现在 使 用 这 台 计 算 机 ? 

电 传 ， 告诉 我 更 多 有 关 你 预期 的 用 户 的 事 。， 

副 总 裁 : 打 电 话 给 我 

注意 在 这 自 话 之 后 ， 总 裁 先 生 没有 遵循 指令 ， 忘 了 在 后 面 加 个 名 号， 因此 计算 机 没有 回 
答 他 的 话 ， 这 激 婚 了 副 总 裁 先 生 ， 他 以 为 我 一 直 在 教 衍 他 ， 于 是 给 我 打 了 个 电话 ， 把 我 从 睡 
梦 中 叫 醒 .。 

副 总 裁 : 你 跟 我 摘 什 么 鬼 ? 

Bobrow: 搞鬼 ?我 处 明白 您 说 的 是 什么 意思 ，。 

副 总 栽 先生 生气 地 把 对 话 记录 读 给 我 听 ， 电 话 那 头 传 来 我 乐 不 可 支 的 大 医 声 。 我 费 了 好 
长 时 间 才 让 他 明白 跟 他 谈话 的 是 计算 机 。 


注 电 ，Eliza/Doctor 软件 通常 用 开放 式 问 名 与 用 户 交 谈 ， 这 样 可 以 促使 用 户 输入 更 多 的 名 
了 了 。 它 并 不 想 回 答 问题 ， 因 为 包 没 这 个 能 力 。 虽 然 如 此 ， 这 个 程序 还 是 糊弄 了 精通 计算 机 的 
副 总 裁 寺 乍 。 它 之 所 以 能 糊弄 人 ， 并 不 是 因为 它 的 智能 ， 它 是 靠 人 木 身 的 弱点 而 通过 Turing 
试验 的 。 惟 管 在 那个 时 代 它 显得 新 奇 ， 但 从 今天 的 标准 看 ， 这 个 软件 还 是 相当 初级 。 它 能 够 
敬 骗 人 们 因为 人 们 太 容易 被 欺骗 ， 所 以 这 个 测验 不 够 磷 分 。 因 此 ， 第 一 次 Turing 测验 也 以 失 
败 告终 。 


5.6.3 ”Deoctor 面 对 Doctor 
出 于 好 想 天 开 、 对 黑客 价值 的 重视 以 及 寻找 乐趣 ， 妆 由 软件 基金 在 他 们 流行 的 GNU 编 
辑 咒 产品 中 创建 了 精神 病 于 后 对 话 程序 。GNU-EMACS 编辑 器 是 一 个 免费 软件 ， 在 绝 大 多 数 
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鸣 UNIX 系统 中 都 可以 见 到 ， 当 你 启动 GNU-EMACS,， 町 入 命令 “escape-x doctor” 邮 可 启动 
该 程 厅 。 我 想 如 玉 把 岗 个 Doctor 程序 的 实例 背 塞 涌 地 连接 在 一 起 ， 计 它们 互 相对 话 ， 衣 定 很 
好 天， 上 向 尽 试 答 结 果 : 

: 我 是 精神 病 医生 ， 请 描述 你 的 问题 

: 谁 叫 你 来 看 我 的 ? 

伟 能 说 得 详细 一 点 码 ? 

:如果 你 继续 、 我 会 有 兴趣 的 ， 

: 你 为 什么 相信 和 如果 我 继续 你 会 有 兴趣 的 ? 

作为 什么 这 样 说 " 

doctor ] 开始 出 现 语 活 错 庶 ] 

: 当 我 说 这 些 的 时 候 ， 你 是 什么 时 候 知道 的 。 

| doctor 2 也 开始 出 现 语法 错误 | 

2: 当 我 第 一 次 知道 你 说 那些 的 时 候 发 生 了 什么 ， 

1]: 如 果 你 第 一 次 知道 禾 说 那些 的 时 候 会 发 生 什么 ? 

2:， 你 所 说 的 那些 是 不 总 真正 的 原因 ? 
1 
2: 


一 一 


我 说 的 那些 是 不 是 真正 的 原因 是 真正 的 原因 吗 ? 
你 所 说 的 那些 是 不 症 真 正 的 原因 是 真正 的 原因 是 不 是 解释 了 其 他 的 东西 呢 ? 

1; 我 所 说 的 那些 是 不 是 真正 的 原因 是 真正 的 原因 是 不 是 解释 了 其 他 的 东西 是 不 是 解释 
了 其 他 的 东西 ? 

2: 你 确信 你 所 说 的 真正 的 原因 是 真正 的 原 困 解释 了 其 他 的 东西 解释 了 其 他 的 东西 吗 ? 
你 确保 真正 的 原因 二 真正 的 原因 解释 了 其 他 的 东西 解释 了 其 他 的 东西 吗 ? 
tb es 
: 开始 时 你 说 是 谁 叫 作 未 看 我 的 让 你 想起 了 什么 ? 
ce 让 我 想起 了 什么 吗 ? 
ne 

你 让 我 想起 什么 我 让 你 想起 什么 ， 你 是 不 是 生气 了 ? 
doctorl 想 换个 话题 ， 并 修正 语法 错误 ， 结 果 却 陷入 死 循 环 ] 

你 经 常生 气 吗 ? 
你 经 常生 气 吗 ? 
; 是 什么 让 你 生气 的 ? 
: 你 确信 你 生气 了 吗 ? 
: 是 什么 让 你 相信 你 生 气 了 的 ? 
你 经 常生 和 气 吗 ? 
;你 经 常生 气 吗 ? 
事实 上 ， 你 可 以 看 到 ， 对 话 过 程 并 不 是 很 有 趣 。 这 个 对 话 显示 了 Doctor 程序 的 上 要 谈话 
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子 中 重复 后 面 儿 个 词 把 它 作 为 问 句 时 ,结果 产生 了 它 自 己 也 无 法 分 析 的 复杂 句子 .尽管 Doctor 
程序 兽 使 很 多 人 误 以 为 它 是 -个 人 ， 作 看 了 上 面 的 对 证 ， 柏 信 淡 人 会 被 糊弄 。 


5.6.4 波士顿 的 奖品 


时 光 快 速 流 进 ， 转 眼 已 盐 1991 年 了 。 计 算 机 系统 变 得 更 快 更 嗓 大。 大 们 在 大 上 智能 
领域 的 各 方面 投入 人 斌 究 已 经 超过 四 分 之 一 个 世纪 。 计 我 们 看 一 下 最 新 和 最 壮 间 的 Turing 
测验 。 

1991 年 11 月 ， 波 十 顿 计 算 机 博物 馆 协 问 国家 科学 基金 会 利 Alfred PSloan 基金 会 ， 上 上 兴 
本 一 个 Turing 测验 的 公共 演 泵 会 。 睦 物 馆 通过 在 波 . 上 顿 的 报纸 上 痘 广告 来 选择 人 类 讯问 者 。 
博物 馆 希 望 讯问 者 能 代表 普通 人 《而 不 是 共有 特殊 此 学 和 语言 学 知识 的 科学 家 )。 :个 山 10 
名 讯问 者 组 成 的 小 组 通过 终端 与 十 几 个 程序 和 健谈 者 进行 3 个 小 时 的 谈话 。 以 下 是 -- 段 暴 者 
的 对 话 ， 

终端 : 一 个 奇想 就 是 一 阵 突然 的 引 人 注 目的 而 且 经 常 是 很 特别 的 行为 。 就 像 是 一 束 日 光 
照射 在 死 气 沉沉 的 灰色 世界 里 。 

讯 可 者 ; 好 像 是 一 种 直觉 ? 

终端 : 每 个 人 都 计划 做 些 什么 ， 而 且 每 个 人 都 确实 做 了 些 事 ， 但 没有 一 个 人 所 做 的 是 他 
所 计划 的 。 

讯问 者 : 嗯 ， 不 管 怎样 我 觉得 异想天开 的 谈话 犹如 国际 象 枢 中 马 的 一 连 串 移动 一 一 是 一 
个 之 字 型 的 移动 而 不 是 按照 某 条 特定 的 路 线 移动 。 

终端 : 一 个 异想天开 的 人 受 古 怪 的 行为 和 不 可 预测 的 想法 的 支配 .,. 不 可 预测 ， 这 太 棱 
EE 

肥 不 彩 性 ， 上 面 的 终端 实际 上 是 一 个 计算 机 程序 。 它 的 做 法 和 Eliza 一 样 ， 道 过 分 析 诸 
法 和 讯 可 者 输入 的 文本 中 的 关键 词 ， 并 从 它 已 大 存储 量 的 现成 短 诉 数据 库 中 根据 匹配 的 话题 
挑选 出 一 些 组 成 回答。 它 并 不 在 讯问 者 的 话 后 曾 复 制 最 后 凡 个 词 来 组 成 回应 ， 从 亨 避 免 了 谣 
面 出 现 的 “doctor 的 困境 "。 相 反 ， 它 通过 持续 引入 新 《但 相关 ) 的 话题 使 谈话 得 以 继续 。 

所 以 ， 上 上面 所 示 的 程序 让 10 个 讯问 者 中 的 个 上 当 也 毫 不 奇怪 ， 他 们 在 经 过 十 面谈 话 


ET 


上 面 的 程序 无 法 直接 回答 一 个 简单 的 问题 《“[ 你 认为 ] 好 像 是 -一 种 直觉 ?”)， 这 是 计算 机 
科学 家 所 向 临 的 最 大 难题 ， 也 反映 了 Turing 测验 的 主机 弱点 ;简单 交 流 中 半 适 当 的 短语 并 不 
能 提示 说 话 者 的 想法 一 一 我 们 不 得 不 看 一 下 交流 的 内 容 。 

Turing 测验 被 反复 证 明 龙 不 够 充分 的 。 它 依靠 记 而 现象 ， 而 人 们 太 容易 被 去 面 现 象 所 晤 
骗 。 它 与 模仿 一 个 活动 的 外 在 表象 与 该 活动 相伴 随 的 人 的 内 心思 维 是 否 显著 的 重要 示 学 问题 
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人 由 此 其 远 ， 人 类 讯 同 者 道 党 无 法 对 一 些 必要 的 细节 作出 精确 的 判断 。 由 寺 人 们 日 贡 谈 话 经 历 
中 的 变 谈 对 象 帮 是 人 ， 所 以 人 们 很 白 然 地 以 为 所 有 的 谈话 《无 论 多 么 泉 板 ) 部 是 在 人 与 人 之 
加 进行 的 。 

尽管 儿 次 试验 均 洁 失 贴 ， 人 工 智 能 社区 很 不 愿意 放 育 这 个 浏 验 。 对 于 这 个 测试 ， 人 许多 
理论 | 的 辩解 : 它 华 理论 上 .的 简单 性 共有 强烈 的 魅力 。 但 如 果 企 实际 应 用 中 如 得 不 可 行 ， 事 
么 它 必 然 需 机 修改 或 者 放弃 。 

最 初 的 Turing 测验 被 解释 为 讯问 者 是 省 能 够 道 过 电 传 区 分 女人 和 伪装 成 女人 的 男人 ， 
Turing 并 设 有 站 接 在 他 的 论文 中 说 时 测验 这 个 问题 是 不 够 充分 的 。 

有 些 人 或 许 觉得 所 需要 的 就 十 重新 强调 谈话 的 这 个 方面 ， 就 是 党 ， 要 求 讯 剖 者 辨认 通 
过 电话 谈话 的 对 象 到 底 是 不 是 人 。 我 不 认为 这 会 有 什么 成 果 。 为 了 简单 起 网 ，1991 年 的 计 
算 机 博物 馆 测试 把 每 个 由 传 的 谈话 内 容 限定 为 一 个 领域 ， 不 回 的 程序 有 不 同 的 知识 库 ， 话 
题 覆 六 购物、 天气 、 育 由 长 想 等 。 为 了 证 程序 根据 人 的 情况 给 出 “组 人 台 适 的 评论 和 耻 明 的 
反应， 这 是 有 必要 的 。Turing 在 沦 文 里 说 坪 分 钟 对 于 这 样 的 测验 应 该 是 足够 了 ， 供 现在 看 
来 不 足 很 充分 。 

修 止 Turing 测验 的 一 种 方法 是 修补 有 忽 陷 的 环节 :， 人 类 的 易 受 骗 性 .正如 要 求 医生 在 
执行 检查 出 需要 经 过 儿 年 的 学 习 一 样 ， 我 们 也 应 该 附加 条 件 ， 就 是 Turing 测验 的 讯问 者 不 
应 是 - 般 店 氏 的 代表 。 讯 问 者 应 该 对 计算 相当 精通 ， 其 全 是 坦 些 熟悉 计算 机 系统 的 能 力 和 
毗 点 的 研究 牛 。 这 样 ， 他 们 就 不 会 被 那些 代 普 真实 回答 的 从 人 型 数据 库 中 抽取 出 米 的 机 知 
话语 所 蒙蔽 。 

慷 一 个 有 趣 的 想法 是 探究 终端 所 显示 的 幽默 感 。 让 它 分 辨 某 个 特定 的 履 事 是 否 是 … 个 笑 
话 ， 并 解释 它 为 什么 好 笑 。 我 觉得 这 种 测试 太 严格 了 一 一 很 多 真实 的 人 也 未 必 道 得 过 。 

尽管 Turing 是 一 位 杰出 的 理论 家 ， 但 当面 临 实际 问题 时 ， 他 常常 显得 -- 泡 是 处 ， 他 的 不 
切实 际 性 以 一 种 不 寻常 的 方式 表现 出 来 :在 他 的 办 公 室 时 ， 他 把 啤酒 钠 挫 在 散热 器 上， 防止 
他 的 问 事 们 使 用 。 他 们 很 自然 地 把 这 个 当 作 是 种 挑战 ， 便 播 开 锁 ， 姿 意 饮 用 。 他 常常 跟 十 
几 类 里 其 至 更 远 去 赴 一 个 约会 ， 而 个 使 用 公共 交通 |. 具 ， 每 次 总 龙 筋 疲 力 尽 ， 却 从 不 述 到 。 
当 1939 年 欧洲 爆发 战争 时 , Turing 把 他 的 积 蕾 换 作 两 个 大 银 块 ,把 它们 埋 在 乡村 以 保证 安全 。 
但 战争 结束 时 他 却 点 了 把 它们 埋 在 哪里 了 。 最 终 ，Turing 以 -- 种 很 有 个 性 的 不 实际 的 方式 白 
杀 : 他 吃 了 - -个 注射 了 氰 化 物 的 苹果 。 这 个 以 他 的 名 字 命 名 的 测验 理论 性 强 于 实践 性 。 理 论 
和 实践 的 区 别 实际 十 比 理论 上 想象 的 还 要 大 。 

5.6.6 后 记 

Turing 同时 记载 ,他 相 ' 寡 “到 20 世纪 末 ， 词汇 的 使 用 和 全 民 教 育 水 平 的 提高 将 带 来 很 人 
的 变化 ， 人 们 将 可 以 说 机 器 具有 思维 能 力 ， 而 不 会 出 现 白 相 矛盾 。” 这 实际 上 比 Turing 预想 
得 要 发 生得 早 得 多 , 程序 员 们 习惯 性 地 根据 其 思维 过 程 米 解 释 计 算 机 的 怪异 行为 :“ 你 没有 按 
下 加 车 键 ， 所 以 机 器 以 为 还 有 更 多 的 输入 ， 所 以 它 就 等 待 .” 然 而 ， 这 是 由 于 “思维 ”这 个 词 
没有 原先 的 意思 那么 高 线 ， 向 不 是 如 Turing 所 预言 的 那样 机 器 有 了 意识 。 
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Atan Turing 被 公认 为 计算 领域 最 伟大 的 理论 先行 者 之 一 ， 为 了 纪念 他 ， 关 屿 计算 机 协会 
把 它 的 最 高 年 度 奖项 命名 为 Turing Award (图 灵 疾 )，1983 年 的 网 史 奖 授 闻 三 Dennis Ritchie 
利 Ken Thompson， 以 表彰 他 们 在 UNIX 和 CC 语言 上 的 杰出 页 献 。 


5.6.7 更 多 阅读 材料 


如 果 你 对 人 人 工 知 能 的 蕉 展 和 局 限 性 很 有 兴 超 ， -本 非常 好 的 消 是 Whar Compurers SI 
Can't Do: A Critigue of Artificial Reason,， Hubert .Dreyfus,MIT press 出 版 ， 波 士 顿 ，1992 
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运动 的 诗 章 : 运行 时 数据 结 


#41: 企业 遇见 上 冲 、 它 是 个 孩子 ， 是 台 计 算 机 ， 或 者 是 一 个 C 程序 . 

#42; 大 胆 地 走 在 一 盘 近 来 只 有 少数 人 走 过 的 路 上 时 ， 企 业 计算 机 被 一 种 强大 的 外 国生 
活 形 式 所 破坏 ， 它 的 形态 惊奇 得 和 人 一 样 。 

#3: Trekkers 遇见 充 , 满 敌 意 的 计算 机 智能 ， 滥 用 哲学 和 还 辑 使 它 自 我 狼 灭 ， 

#44: Trekkers 遇见 一 种 文明 ， 它 与 先前 的 地 球 文 明 今 人 吃惊 地 相 旬 . 

#45; 疾病 使 一 个 或 多 个 船员 迅速 变 老 。 同 时 也 有 反方 向 的 例子 :关键 的 船员 回 到 了 童 
年 ,无 沦 从 生理 上 ，、 智 力 上 还 是 两 者 都 是 ， 

#46: 一 个 外 星 生命 就 入 了 一 个 Trekker 的 身体 ， 并 且 控 制 了 它 。 继 续 等 待 看 到 相反 的 事 
情 发 生 . 

#47: 船长 在 矫正 事物 时 违背 了 基本 指 未 ， 可 能 使 企业 处 于 危险 之 中 ， 也 可 能 与 一 个 迷 
人 的 外 国人 有 染 ， 或 者 两 者 都 是 . 

#48: 船长 最 终 把 和 平 带 给 了 一 个 极 像 地 球 的 世界 上 两 个 原始 的 处 于 战争 状态 的 社会 
(“我 们 进入 和 平 ， 枪 杀 之 。”) 


— $0pe RA Canonical Star Trek Plots, and Delicious Yam Recipes 


编程 语言 理论 的 经 典 对 立 之 一 就 是 代码 和 数据 的 区 别 。 有 些 语言 如 LISP 把 两 者 视 为 - 
体 。 其 他 诸 言 《例如 C 语 言 ) 通常 维持 两 者 的 区 别 。 第 2 章 所 措 述 的 Intemet 蜂 虫 非常 准 以 
为 人 们 所 坦 解 ， 因 为 它 的 攻击 方法 的 原理 就 是 把 数据 转换 为 代码 。 代 码 和 数据 的 区 别 也 可 以 
认为 是 编 详 时 和 和 运行 时 的 分 界线 。 编 译 器 的 绝 大 部 分 下 作 都 跟 翻 译 代码 有 关 ;， 必要 的 数据 存 
储 管理 的 绝 大 部 分 都 在 运行 时 进行 。 本 章 描述 运行 时 系统 中 隐 注 的 数据 结构 。 

我 们 之 所 以 旧 学 习 运 行 时 系统 ， 主 要 有 3 个 理 出 ; 
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* 它 有 助 于 优化 代码 ， 效 得 最 佳 的 效率 。 
， 它 有 助 于 理解 更 高 线 的 材料 。 
， 漳 阶 入 麻烦 时 ， 它 可 以 使 分 析 问 题 更 加 容易 。 


6.1 a.0ut 及 其 传说 


你 是 否 锭 疑 感 “a.out” 这 个 名 字 是 怎样 确定 的 ? 把 所 有 的 输出 文件 都 缺 省 地 使 用 同 个 
名 字 a.out 可 能 会 带 来 不 使 ,可 能 会 占 了 它 来 自 哪 一 个 源 文件 ,对 任何 文 作 进 行 下 “次 编译 时 
部 有 可 能 覆 兰 它 。 大 多数 人 者 有 一 个 模糊 的 印象 , 觉得 这 个 名 字 秉 承 了 UNIX 传统 的 简洁 性 ， 
而 H.“a” 起 字母 表 的 每 个 字母 ， 所 以 首先 会 想到 用 它 来 命令 新 文件 。 囊 实 上 |， 之 所 以 取 这 
个 名 字 跟 这 些 堂 无 关系 。 

它 她 “assembler output 《汇编 程序 输出 )” 的 缩写 形式 ! 老式 的 BSD 文档 里 其 全 有 有 下面 
的 提示 : 


NA 
a.oui … 污 编 程序 和 链接 编辑 输出 格式 

这 里 有 -个 问题 ， 它 不 是 污 : 编 程序 输出 ， 而 是 链接 器 输出 ! 

“汇编 程序 输出 ”这 个 名 字 的 产生 纯 属 历史 原因 。 在 PDP-7 (其 全 比 B 诸 辣 还 旺 ) 上 并 
个 存在 链接 器 ， 程 序 起 这 样 创建 的 ， 先 把 所 有 源 文 件 连 接任 -上 起， 然后 进行 汇编 ， 汇 编 产 生 
的 并 -编程 序 输出 保存 在 aout 中 。 即 使 人 们 最 终 为 PDP-11 编写 了 链接 器 之 后 ， 最 后 - -个 环节 
的 得 出 文件 依然 沿用 了 这 个 命名 习惯 。 这 个 名 字 曾 被 解释 为 “新 程序 准备 就 纤 ， 打 算 执 行 ”， 
所 以 缺 省 使 用 a.out 这 个 名 学 是 UNIX“ 没 什么 理由 ， 但 我 们 就 是 这 样 做 的 ”思维 的 “- 例 ! 

UNIX 中 的 可 执行 文件 也 是 以 一 种 特殊 的 方式 加 上 标签 ， 这 样 系统 就 能 确认 它们 的 特 风 
届 性 .为 重要 的 数据 定义 标签 , 用 独特 的 数字 惟一 地 标识 该 数据 赴 一 -种 普遍 采用 的 编程 技巧。 
标签 历 定义 的 数字 通常 被 称 为 “神奇 ”数字 ， 它 是 一 种 能 够 确认 -一 织 随机 的 二 进 制 位 集合 的 
虱 秘 力量 。 例 如， 超级 块 “superblock，UNIX 文件 系统 中 的 基础 数据 结构 ) 就 是 用 下 而 这 个 
神奇 数字 惟一 标识 的 ; 

#define FS MAGIC Oxt11]1954 

这 个 看 上 去 很 奇怪 的 数字 其 实 并 不 是 任意 选择 的 。 它 是 Kirk MeKusick 的 生日 。Kirk 是 
Berkeley fast 文件 系统 的 实现 者 ， 他 于 20 世纪 70 年 代 晚 期 编写 了 这 些 代 码 。 但 神奇 数 宁 非 





第 有 用 ， 所 以 时 全 今日 ， 上 而 这 个 神奇 数字 仍然 在 source base 中 使 用 《位 于 交 件 
sys/fs/ufs_fs.h)。 它 不 仅 增强 了 文件 系统 的 可 靠 性 , | 同时 矢 个 文件 系统 的 黑客 都 知道 在 每 年 的 
1 月 19 日 也 就 是 Kirk 的 生日 向 他 发 一 张 生日 贺卡 。 

在 aout 文件 中 也 存在 类 似 的 神 冶 数字 。 在 AT&T 的 UNIX Systme V 发 布 之 前 ， a.out 文 
件 被 标识 为 神奇 数 宁 0407， 偏 移 为 零 。 为 什么 选择 0407 作为 确认 UNIX 日 标 文 件 的 神兽 数 
了 呢 ? 它 是 PDP-11 :条 无 祭 件 转移 指令 的 (相对 于 程序 计数 器 ) 的 二 进 制 编码 ! 如 果 人 在 兼 
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窑 模 式 下 运行 PDP-11 或 YAX， 可 以 先 执行 文件 的 第 一 个 字 ， 然 后 这 个 神 闸 数字 (位 于 那 操 ) 
会 带 你 跳 过 a.out 尖 交 件 , 进入 程序 第 -个 真正 的 可 执行 指令 ,> a.out 需要 中 入 神 闸 数 下 时 ， 
PDP-11 正 是 当时 最 正统 的 UNIX 机 器 。 在 SYr4 中 ， 可 执行 文件 用 文件 的 第 … 个 字 节 来 标注 ， 
文件 以 十 六 进 制 数 7F 带 淮 ， 紧 跟 在 后 面 的 第 :至 第 败 个 字 节 为 “ELE7”。 


6.2 段 


时 标 文件 和 可 执行 文件 可 以 有 几 种 不 同 的 格式 。 在 绝 大 多 数 SYr4 实现 中 邦 采 用 了 -种 
称 作 ELF (原意 为 “Extersible Linker Format， 林 扩展 链接 器 格式 ”、 现在 代表 “Executable and 
Linking Format, 可 执行 文件 和 链接 格式 ”的 格式 。 在 其 他 系统 中 , 可 执行 文件 的 格式 是 COFF 
(Common Ojbect-File Fornat， 普 道 目 标 文件 档 式 )。 在 BSD UNIX 中 【〈 就 像 佛 具有 佛 的 本 性 
一 样 )，a.out 文件 具有 a.out 格式 。 可 以 通过 键入 man a.out 在 王 文 档 中 查看 更 多 有 关 UNIX 
系统 所 使 用 的 格式 的 信息 。 

所 有 这 些 不 同 格式 上 共有 -个 共同 的 概念 , 那 就 是 段 (segments)。 后 徊 还 将 讲述 很 多 和 和 段 有 
关 的 内 容 ， 但 就 上 月 标 文件 而 言 ， 它 们 是 二 进 制 文件 中 简单 的 区 域 ， 自打 保存 了 和 某 种 特定 类 
型 《如 符号 表 条 日 ) 相关 :的 所 有 信息 。 术 语 section 也 被 广泛 全 用 ，section 是 ELF 文件 中 的 
最 小 组 织 单位 。 一 个 段 - 般 包含 几 个 section。 

不 要 把 UNIX 中 段 的 概念 跟 Intel x86 架构 中 息 的 概念 混淆 。 

在 UNIX 中 ， 段 表示 - :个 二 进 制 文件 相关 的 内 容 块 。 

在 Intel x86 的 内 存 模 型 中 ， 段 表示 一 种 说 计 的 结果 。 在 这 种 设计 中 【基于 兼容 性 原 内 )， 
地 址 空间 并 划一 个 整体 ， 耐 是 分 成 一 些 64K 大 小 的 区 域 ， 称 之 为 段 。 

关于 Intel x86 架构 里 面 段 的 话题 本 上 壬 也 值得 用 整整 一 章 来 描述 '。 在 本 书 的 剩余 部 分 ， 如 
果 不 作 特别 说 明 ， 段 这 个 术语 是 指 UNIX 上 的 段 。 

当 在 一 个 可 执行 文件 中 运行 size 命令 时 ， 它 会 告诉 你 这 个 文件 中 的 三 个 段 〈 文 本 段 ， 数 
据 段 和 bss 段 ) 的 大 小 ， 


务 echo; echo *text data bss total" ; gize a.out 


ext data bss total 
1548 + 4236 + 4004 = 9788 


size 命令 并 不 打印 标题 ， 所 以 要 用 echo 命令 产生 它们 。 
检查 可 执行 文件 的 内 容 的 另 - -种 方法 是 使 用 nm 或 dump 实用 工具 。 编 详 下 所 的 源 文 件 ， 
在 结果 的 aout 文件 上 运行 am 程序 。 
char Pear [40]; 


static double peech; 
int mangc = 13，; 


， 它 的 确 差 不 久 用 了 总 米 讲述 ， 请 大 下 ~ 章 。 
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Staciece long meion = 2001 7 


ma { 


本 

-p = malloc(lsir eofLt:)): 
Pear 3, = 1.: 

Deacm = 2.0 * MAargor 


am 程序 运行 结果 的 摘 村 如 下 《我 对 输出 作 二 一 些 徽 小 的 修改 ， 使 它们 更 容易 阅读 ): 


$$ PT -SX 五 .CU 
SYmbo .5 from .OU : 


| Tidex] yaluec SLZe Ty pe Bing Soegment Name 
1291 Oxo0D20795 | 0x00032003 | ORJT LOCL 1 .bss weach 
[42] dxQ002079¢ | Ox00020028 .+ OPJT | SLOB | .bsg pear 


| 
| 
[4 3 1] | 2XDUD206T4 | 0Qx00050804 ! GBJYL' SLOB | .dala marllgo 
[33] | OXx0002058E8 1 Oxo0050054 | ORST | LOCL | .data meion 
[36) 1 Ox0001735828 ，DxD0000058 | FUNY |} GLOR i; .text main 
[50] | vx00022604 | Ox00005538 | FUNC | SILOB | UNDES malloc 


图 6-1 显示 了 了 编 详 器 和 链接 器 分 别 在 这 些 段 中 写 入 了 什么 东西 





关键 : 
Bt : 
源 文件 aout 文件 





Te sout 定 奇 数 子 


int rmmapko = 13; 


static Jong melon =: 20X)|; 


oe i a mn| 


| 


可 执行 文件 的 指令 


局 珊 变 量 并 不 进入 aout， 它 们 
在 运 行 时 记 建 ， 


图 6-1 C 语 蚀 的 各 部 分 会 出 现在 哪些 段 中 
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BSS 段 这 个 名 字 是 “Block Started by Symbol (由 符 蕊 开始 的 块 )7 的 缩写 ， 它 起 月 式 IBM 
704 汇编 程序 的 “个 伪 指 令 ，UNIX 借用 了 这 个 名 子 ， 全 今 依然 沿用 。 有 些 人 如 欢 把 它 记 作 
由 于 BSS 段 上 只 保存 没有 全 的 变星 ， 所 以 事实 二 筷 
并 不 需要 保存 这 些 变 量 的 肢 像 。 运 行 时 所 需要 的 BSS 段 的 人 小 记录 在 避 标 文件 '|', 但 BSS 
成 ‘不 像 其 他 上段， 并 不 占据 日 款 交 件 的 任何 空间 。 


rm RE PP OR ET OA a NN 


编程 挑战 


RN THE MP ER PEI VO PEROT ONIN NA ANN aceomem 本 且 和 








ED 


查看 可 执行 文件 中 的 段 


]. 编译 “hello world” 痊 序 ， 在 可 执行 文件 中 质 行 -1， 得 到 文件 的 总 体 大 小 : 运行 size 
得 到 文件 里 各 个 段 的 大 小 . 

2. 增加 一 个 全 局 的 int|1000] 数 组 声明 ， 重 新 进行 编译 ， 再 用 上 面 的 命令 得 到 总 体 及 各 个 
段 的 大 小 ， 注 意 前 后 的 区 别 |。 

3. 现在 ， 在 数组 的 声明 中 增加 初始 值 ( 记 住 ，C 语言 并 不 强迫 对 数组 进行 初始 化 时 为 每 
个 元 素 提 供 初 始 值 ) ,这 将 使 数组 从 BSS 段 转 措 到 数据 段 ， 重复 上 面 的 测量 ， 注 意 各 个 段 前 
后 大 小 的 区 别 ， 

4. 现在 ， 在 通 数 内 声明 一 个 巨大 的 数组 、 然 后 再 声明 一 个 巨大 的 局 部 数组 ， 但 这 次 加 上 
初始 值 。 重 复 上 面 的 测量 。 定 义 于 函数 内 部 的 局 部 数组 存储 在 可 执行 文件 中 吗 ? 有 没有 初始 
化 有 什么 不 同 吗 ? 

5. 如 果 在 调试 状态 下 编译 、 文 件 和 段 的 大 小 有 没有 变化 ? 是 为 了 最 大 程度 的 优化 吗 ” 

分 析 上 面 “ 编 程 挑 战 ”的 结果 ， 使 自己 确信 : 

， 数据 段 保存 在 目标 文件 中 。 

， SS 段 不 保存 在 目标 文件 中 《除了 记录 BSS 段 在 运行 时 所 需要 的 大 小 ) ， 

”文本 段 是 最 容易 受 优 化 措施 影响 的 段 ， 

“aout 文 件 的 大 小 受 调 试 状态 下 编译 的 影响 ， 但 段 不 受 影响 。 


Oe 


6.3 操作 系统 在 a.out 文件 里 干 了 些 什 么 


现在 , 让 我 们 看 看 为 什么 a.out 要 以 段 的 形式 组 织 。 段 可 以 方便 地 映射 到 链接 器 在 运行 时 
可 以 直接 载 入 的 对 和 象 中 ! 载 入 器 只是 息 文 件 中 每 个 段 的 映像 ， 并 各 接 将 它们 放 入 内 存 中 ， 从 
本 质 上 说 ， 段 在 下 在 执行 的 程序 中 是 一 块 内 存 区域 ， 每 个 区 域 都 有 特定 的 月 的 。 网 6-2 显示 
了 这 一 点 ， 

文本 段 包含 程序 的 指令 。 链接 器 把 指令 直接 从 文件 拷 具 到 内 存 中 (一 般 使 用 mmap0 系 统 
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调用 )， 以 后 使 也 也 不 用 管 它 。 因 为 在 典型 情况 下 ,程序 的 交 术 盛 论 是 内 容 还 是 大 小 都 不 会 疏 
变 。 有些 操作 系统 和 链接 红 其 至 可 以 向 段 中 不 同 的 section 赋 了 适当 的 野性 ， 例 如， 文本 可 以 
被 设 普 为 read-and-execute-only 《只 人 允许 读 和 和 执行 )， 有 些 数 据 可 以 被 设置 为 
read-write-no-execute《 允许 芯 和 写 ， 但 不 允许 执行 )， 而 另外 -一些 数据 则 被 设 痊 为 read-only 
(只 读 ) 等 。 


进程 的 地 址 空间 
氢 高 内 阐 地 直 : 


{局 部 于 邮 





拆 的 数控 ) 
3a.00t 文件 江油 
1 1 
aout 的 祁 育 数字 : 

i 木 贸 站 化 

的 数据 1 
经 过 初始 化 的 个 局 :经 过 补 始 
和 静态 安 且 化 区 数据 ) 

可 执行 文件 的 指令 女 本 虹 指令; 





服 低 内 存 地 址 


图 6-2 可 执行 交 件 中 的 段 在 内 存 中 如 何 布 局 


数 挫 段 包含 经 过 初 既 化 的 全 局 和 静态 变量 以 及 它们 的 值 ，BSS 段 的 大 小 从 可 执行 多 件 中 
得 到 ， 然 后 链接 器 得 到 这 个 大 小 的 内 存 块 ， 紧 跟 在 数据 段 之 后 。 当 这 个 为 存 区 进入 程序 的 地 
址 罕 间 后 全 部 清 宰 。 包 括 数据 段 和 BSS 段 的 整个 区 段 此 时 通常 统称 为 数据 区 。 这 是 因为 在 操 
作 系统 的 内 存 管 理 术 诸 中 , 段 就 是 一 片 连续 的 虚拟 地 址 ,所 以 相 邻 的 段 被 接合 。 一 般 情 况 下 ， 
人 在 什 何 进程 中 数据 段 是 最 大 的 段 。 

这 个 图 显示 了 一 个 即将 执行 的 程序 的 内 存 布局 。 我 们 仍然 需要 -- 些 为 存 空间 ， 用 于 保存 
局 部 变量 、 临 时 数据 、 传 汗 到 沙 数 中 的 参数 等 。 堆 栈 段 (stack segment) 就 是 用 十 这 个 日 的 。 我 
们 偿 需要 堆 (heap) 空 间 ， 用 于 动态 分 配 的 内 存 。 只 要 调用 mailoc0) 卸 数 ， 就 可 以 根据 需要 在 堆 
上 分 配 内 存 。 

注意 虚拟 地 址 空间 的 盟 低 部 分 未 被 映射 。 也 就 是 说 ， 它 位 丁 进程 的 地 址 空间 内 ， 但 并 未 
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赋予 物 符 地 址 ， 所 以 任何 对 它 的 引用 都 是 非法 的 。 在 典型 情况 下， 它 是 从 地 址 零 寺 始 的 几 K 

字 节 。 它 用 十 捕 提 使 用 空 指针 和 小 整 型 值 的 指针 引用 内 存 的 情况 。 
当 考 虑 其 享 库 时 ， 进 程 的 地 址 空间 的 样子 如 疼 6-3 所 示 。 





最 高 旧 比 
堆栈 
i 一 一 堆栈 限制 

链接 器 

串 - 一 中 块 术 映射 的 段 
数 所 
文 本 

共享 库 扰 映射 到 这 让 

数 据 
立木 

十 -一 全 油 5 林 呐 和 区域， 
数 据 由 下 在 执行 的 程序 合川 
文 本 


最 低地 址 一 -一 研一 第 0 页 卡 被 鼎 则 
图 6-3 显示 共 字 库 的 虚拟 地 址 空间 布局 


6.4 语言 运行 时 系统 在 a.out 里 干 了 些 什 么 


现任 讨论 己 语 言 怎样 组 织 正在 运行 的 程序 的 数据 结构 的 细节 。 送 行 时 数据 结构 有 好 几 种 ; 
堆栈 、 活 动 记录 (activation recordy、 数 据 、 堆 等 、 我 们 将 依次 讨论 这 些 数 据 结构 ， 并 分 析 它 什 | 
所 文 持 的 C 语言 特性 。 
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堆栈 段 


堆栈 段 包 含 一 种 单一 的 数据 结构 一 一 堆栈 。 堆栈 是 -个 经 典 的 计算 机 科学 对 象 ， 尼 下 一 
块 动态 内 存 区 域 ， 实 现 了 一 种 “后 进 先 出 ”的 结构 ， 有 点 类 似 于 自动 餐厅 时 苏 在 ”起 的 盘子 。 
堆栈 的 经 典 定义 是 它 可 以 放置 作 意 数量 的 盘子 ， 但 惟 :有效 的 操作 就 是 从 项 部 族 或 取 一 个 盘 
子 . 也 就 是 说 ， 值 可 以 未 到 堆栈 中 ， 也 可 以 通过 出 栈 取 得 值 。 入 栈 操作 使 堆栈 变 长 ， 出 栈 抬 
作 从 堆栈 中 取出 一 个 位。 

编译 器 设计 者 采用 了 一 种 稍微 灵活 一 些 的 方法 。 我 们 从 硕 部 增加 战 拿 掉 幢 子 ， 全 我们 也 
可 以 修改 位 于 堆栈 中 部 的 内 子 的 值 。 函 数 可 以 通过 参数 工人 局 指针 访问 它 历 调 用 的 所 数 的 局 
部 变量 。 运 行 时 系统 维护 个 指针 《 常 位 于 寄存 器 中 )， 通 常 称 为 sp， 用 于 提示 堆栈 当前 的 
项 部 位 贮 。 | 堆栈 段 有 一 个 主要 的 用 途 ， 其 中 鸯 个 跟 孙 数 有 关 ， 田 个 嵌 表 达 式 计算 有 大， 

， 堆栈 为 也 数 内 部 声明 的 局 部 变量 提供 存储 空间 ,按照 C 语言 的 术语 ， 这 些 变 此 被 称 
为 “摇动 变量 ” 

*。 进行 函数 调用 时 ，: 磊 栈 存 储 与 此 有 关 的 一 些 维护 性 信息 。 这 些 信息 被 栎 为 堆栈 结构 
(stack frame)， 六 外 一 个 出 常用 的 名 字 古 过 程 活动 记录 (precedure activation recored)。 我 们 将 在 
稍 后 详细 讨论 它 ， 但 现在 只 要 知道 它 包 括 通 数 调 用 地 址 《 即 当 所 调用 的 负数 结束 后 跳 划 的 地 
方 )、 任 何不 适合 装 入 寄存 器 的 参数 以 及 一 些 寄存 器 值 的 保存 。 

。 堆栈 也 可 以 被 用 作 午时 存储 区 。 有 村 候 程序 需要 一些 痪 时 存储 ， 比 如 计算 一 个 很 长 的 
算术 表达 式 时 ， 它 可 以 把 部 分 计算 结果 压 到 堆栈 中 ， 当 表 要 时 再 把 它 从 堆栈 中 取出 。 遂 过 
alloca0 上 是 数 分 本 的 内 存 就 是 位 于 堆栈 中 。 如 果 想 让 内 存在 函数 调用 结束 之 后 仍然 有 有效， 就 不 
此 使 用 alloca() 来 分 配 《 它 将 被 下 个 函数 调用 所 覆 闵 )。 

除了 递归 调用 之 外 ， 堆 栈 并 非 必需 。 因 为 在 编译 时 可 以 知道 局 部 变量、 和 参数 和 返回 地 下 
所 再 空间 的 固定 大 小 ， 并 可 以 将 它们 分 配 于 BSS 段 。BASIC、COBOL 种 FORTRAN 的 早期 
编译 器 并 不 允许 冰 数 的 递归 调用 ， 所 以 它们 在 运行 时 并 本 需 要 动态 的 堆栈 。 人 允许 递归 滑 用 意 
味 独 必须 找到 : -种 方法 ， 在 同一 时 刻 允 许 局 部 变量 的 多 个 实例 存在 ， 但 只 有 最 近 被 创建 的 那 
个 才能 被 访问 ， 这 很 像 堆栈 的 经 典 定义 。 








EEE ED ET A AN A A a oceanremre 


编程 挑战 








探索 堆栈 
编译 并 适 行 这 个 小 型 测试 程序 ， 发 现 你 的 系统 中 堆栈 的 大 致 位 置 : 


#include <Stqic ,hb> 
mainmnify 
{ 

int 工 ， 
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printf{"Iie stack top 1is near Sp\ni", &i},; 
re-url V0: 
} 
发 现 数据 段 和 文本 绒 的 位 置 ， 以 及 位 于 数据 段 内 的 推 ， 方 法 是 声明 位 于 这 些 段 的 变量 ， 
攻打 印 它 们 的 地 址 。 通 过 - 周 用 通 数 和 声明 一 些 大 型 局 部 数组 使 堆栈 增长 
、、 现 在 叭 栈 顶 部 的 位 置 在 儿 里 了 ? 
在 不 同 的 计算 机 架构 和 不 同 的 操作 系统 中 ， 堆 栈 的 位 壮 可 能 各 不 机 问 。 尽 答 讨 论 的 是 堆 
栈 的 项 部， 事实 二 在 绝 大 多 数 处 理 嚣 中， 堆栈 是 向 干 增长 的 ， 也 就 是 朝 着 低地 址 方向 竺 长。 


6.5“ 当 函数 被 调用 时 发 生 了 什么 : 过 程 活动 记录 


本 市 描述 CC 运行 时 系统 在 筷 日 己 的 地 址 室 间 内 如 何 管理 程序 。 事 实 上 ，C 语言 的 运行 时 
消 数 韭 常 少 ， 且 个 个 短小 精 悍 。 相 反 的 例子 是 C++ 或 Ada。 如 果 C 程序 需要 一 - 些 服 务 如 动态 
存储 分 配 ， 它 道 常 必须 进行 显 式 请 求 。 这 使 C 洁 音 成 为 -种 非常 高 效 的 语言 ， 但 它 也 向 程序 
员 施 加 了 一 个 额外 的 负 拓 ， 

C 语言 月 动 提供 的 服务 一 眶 是 跟踪 调用 链 一 一 哪些 函数 调用 了 哪些 秃 数 ， 当 下 一 个 
“rearm” 膏 名 执行 后 ， 控 制 尝 返回 人 向 处 符 。 解决 这 个 问题 的 经 典 机 制 是 堆栈 中 的 过 程 活动 记 
水 中 当 每 个 函数 被 调用 对， 都 会 产生 一 个 过 程 活动 记 隶 〈 或 类 似 的 结构 )d 过 程 活动 记 有 求 是 一 - 
种 数据 结构 ， 用 于 支持 过 程 调 用 ， 并 记录 调用 结束 以 后 返回 调用 点 所 需要 的 全 部 信和 避 、( 参 见 
网 6-4) 










届 部 变 显 (local varibales) 





参数 (argurnents) 


Do “Rs 


静态 链接 (static link) 《用 -于 上 典 叫 用 ，C 庄 训 中 不 使 用 ) 









指 应 先是 结构 的 指针 


返 臣 地 址 {retum :uidress) 





图 64 过 程 活动 记录 的 规范 描述 


活动 记 承 内 容 的 描 达 很 上 共有 说 明 性 。 结 构 的 其 体 细节 在 不 同 的 编译 器 中 各 不 相同 ， 这 些 
子 段 的 次 序 可 能 很 不 相同 ， 而 半 可 能 还 存在 - -个 在 调用 函数 前 保存 寄存 器 值 的 区 域 ， 头 文件 
fusrinclude/sys/frame.h 描述 了 过 程 活动 记录 在 UNIX 系统 中 的 样子 。 在 SPARC 计算 机 上 ,过 
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C 专家 编程 一 
程 活动 记录 非常 人 《 儿 | 个 字 )， 因 为 它 提 供 了 保存 寄存 内 窗 口 的 空间 。 春 : x86 架构 由， 过 程 
活动 记 耿 多少 要 小 些 。 运行 时 系统 维护 一 个 指针 《常常 位 十 寄 疗 器 中 )， 通 常 称 为 tp， 用 
于 提示 活动 堆栈 结构 。 它 六 值 起 最 靠近 堆 梭 顶部 的 过 程 滞 动 记 录 的 地 此 ， 





C 语言 中 一 个 令 人 震惊 的 事实 ! 


绝 大 多 数 的 现代 算法 语言 多 许 隔 数 和 数据 一 样 在 函数 内 部 定义 .CC 语言 不 允许 以 这 种 方 
法 进行 函数 的 嫩 套 、C 语言 中 的 所 有 有 浮 数 在 词法 层次 中 都 是 位 于 最 顶层 ， 

这 个 限制 稍稍 简化 了 C 编译 器 。 在 Pascal、Ada、Modula-2、PU 或 Algol-60 这 些 允 许 
贞 套 过 程 的 语言 中 ， 活 动 记录 一 般 要 包含 一 个 指向 它 的 外 野 通 数 的 活动 记录 的 指针 。 这 个 指 
针 被 称 为 静态 链接 ( static link ) ， 它 允许 内 层 过 程 访 问 外 层 过 程 的 活动 记录 ， 因 此 也 可 以 访 
问 外 层 过 程 的 局 部 数据 。 记 住 在 同一 时 刻 一 个 外 层 过 程 可 能 有 好 几 个 处 于 活动 状态 的 调用 ， 
内 层 过 程 活动 记录 的 静态 链接 将 指向 合适 的 活动 记录 ， 多 许 访问 局 部 数据 的 正确 实例 ， 

这 种 类 型 的 访问 【一 个 章 向 词法 上 外 层 范 围 的 数据 项 的 引用 ) 被 称 作 上 层 引 用 (uplevel 
reference ) ， 静 态 链 接 (指向 从 词法 上 讲 属 于 外 层 过 程 的 活动 记录 ， 由 编译 时 决定 ) 之 所 以 
如 此 命名 是 因为 它 与 动态 链接 相对 照 ， 后 者 是 一 个 活动 记录 指针 链 (在 运行 时 指向 最 靠近 自 
己 的 前 一 个 过 程 调 用 的 活动 记录 ) 。 

在 Sun 的 Pascal 编译 器 中 ， 静 态 链接 被 作为 一 种 附加 的 隐藏 参数 ， 当 需要 时 作为 参数 表 
的 最 后 一 个 参数 被 传递 ， 这 样 就 使 得 Pascal 过 程 具有 和 CC 语言 一 样 的 活动 记录 ， 因 而 可 以 使 
用 相同 的 代码 生成 器 ， 从 而 订 以 与 忆 函数 一 起 工作 。C 语言 本 身 并 不 允许 获 套 函数 ， 因 此 ， 
在 它 的 数据 中 并 没有 上 层 引 月 ， 所 以 在 它 的 活动 记录 中 忆 不 需要 静态 链接 有些 人 要 求 C++ 
应 该 增加 谈 套 函数 这 个 特性 0 

上 面 的 代码 例子 用 于 显示 程序 执行 在 不 同 点 时 堆栈 中 活动 记录 的 情况 。 这 是 本 节 的 -个 
难点 ， 内 为 我 们 不 得 不 处 理 动 态 控制 流 而 不 是 列表 显示 的 静态 代码 。 老实 说， 这 确实 比较 难 ， 
但 正如 Wendy Kaminer 在 她 的 经 典 心 理学 读本 ，7ma Dysfuntiona; You’re Dysfinrctional 中 所 评 
论 的 那样 ， 只 有 短命 鬼才 需要 在 幼儿 园 里 就 学 会 一 切 。 


” 车 广 不 监 把 活动 记录 中 的 静态 链接 癌 前 面 章节 皇 提 到 的 静态 链接 混 为 一 谈 。 前 者 允许 上 层 引 用 癌 法 上 外 层 过 程 的 局 部 数据 ,而 
旺 者 表 杰 一 种 把 所 有 库 的 拷 内 放 于 可 执行 文件 中 的 过 时 方法 。 帮 前 丙 的 章节 时 ，“ 静 态 ” 表 示 “ 丰 编译 时 进行 ”。 在 本 音 ， 它 
疼 示 程序 的 词法 布 摧 。 
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由 泊 志 训 于 


认 一 个 语 志 


地 HE 





a 
罗 





:eri 
PT 


赣 和 竺 和 请 直下 下 计生 时 生计 让 天 


四 
:二 


i 





六 
< 
小 
EE 
陋 


1 aftanre i} 1 

多 工区 
了 人 一) 
4 Eelse 

5 printf{("i has reaCced 并 BEO »*);} 
各 retuyrn; 

人 村 

8 

3 main{} { 

10 ail} 

下 4 | 


如 果 编 译 和 运行 上 面 汶 程序 ， 程 序 的 控制 流 显 示 丁 革 6 每 -个 虚 点 杠 显 未 一 - 段 进行 
峭 数 调用 的 源 六 件 。 己 执 沫 的 语句 用 粗 体 显 赤 ， 当 控制 从 一 个 也 数 转 刘 为 一 个 隐 数 时 ， 堆 栈 
的 新 状态 显 东 丰 下 血 。 程 序 从 main 开始 执行 ， 堆 栈 闪 下 生长 。 

编译 强 设 计 者 通过 不 字 储 木 使 用 的 信息 来 光 高 速度 其 他 的 优化 措施 包括 把 信和 总 保存 于 
寄存 只 而 不 是 扒 栈 中 ， 允 简单 的 冰 数 调用 《〈 昌 身 不 调用 其 他 未 数 ) 不 将 整个 过 程 活 动 记 录入 
栈 以 及 让 被 调用 函数 而 不 总 调用 者 负责 寄存 器 值 的 保 在 上 作 。 记 果 “指向 前 一 个 过 程 活动 记 
录 的 指针 ”位 丁 过程 活动 记录 内 部 ， 就 可 以 简化 当前 函数 返 同 时 返回 到 条 一 个 过 程 活动 记录 
的 任务 。 











NAAN 2 OAT PE RN ruvsvwsvevwsrmatmonvanoppvvvvwvvvewossvwwvoaun 
FP PP PC 
过 程 活动 i 
% 1 
过 程 ; 


1. 手工 跟踪 上 面 这 个 誉 序 的 控制 流 ， 在 每 条 调用 语句 执行 后 填写 过 程 活动 记录 的 内 容 ， 
对 于 每 个 返回 地 址 ， 使 用 它 将 会 返回 的 行 号 ， 

2. 在 现实 中 编译 这 个 程序 ， 并 在 调试 器 中 运行 它 。 当 函数 被 调用 时 ， 注意 堆栈 所 增加 的 
内 容 ， 跟 在 第 1 步 中 所 记录 的 内 容 进 行 对 比 ， 看 看 系统 中 过 程 活动 记录 的 确切 样子 。 

记 住 ， 编 译 器 设计 者 会 尽 可 能 地 把 过 程 活动 记录 的 内 容 放 到 寄存 器 中 (因为 可 以 提高 速 
度 ) ， 所 以 书 上 所 显示 的 在 些 东西 可 能 不 在 堆栈 中 出 现 。 查 看 frame.h 文件 ， 了 和 解 过 程 活动 
记录 的 布局 ， 


eT TE A AEE aa ae、 一 -rr 一 row 


6.6 auto 和 static 关键 字 


对 堆栈 怎样 实现 函数 溃 用 的 描述 也 同时 解释 了 为 什么 不 能 从 阴 数 中 返 问 -个 指向 该 函数 
局 郭 白 动 变量 的 指针 ， 例 好 : 
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第 瑟 章 和 返 六 的 诗 章 : 运行 时 数据 结交 


Char * favorite fxruit () i 
char cecidious|| :: "aople"; 


raeturn Aecidinus: 


当 进 入 该 蚁 数 时 ， 上 日 动作 时 deciduous 企 堆 栈 中 分 醒 ， 当 函数 结束 后 ， 变 量 不 复 存 在 ， 
它 所 占用 的 堆栈 空间 被 ol 收 ， 遇 能 在任 何 时 候 被 入 着。 这 样 ， 指 针 就 失去 了 有 效 性 “引用 不 
仔 在 的 东 凸 )， 被 称 为 “号 冬 指 针 (dangling pointer)” 它们 并 不 引用 有 用 的 东 上 曲 ， 和 而 是 巧 
在 地 址 空间 内 。 如 果 想 返回 一 个 指 阿 在 函数 内 部 定义 的 变量 的 指针 时 ， 要 把 那个 变量 声明 为 
static。 这 样 加 能 保证 该 变量 被 保存 在 数据 段 由 而 不 是 堆栈 让。 该 涩 基 的 生命 期 就 和 程序 一 样 
区 ， 当 定义 该 变量 的 函数 退出 时 ， 该 变量 的 值 依 然 能 保 拌 。 当 该 打数 下 一次 进入 时 ， 该 倘 依 
然 有 效 ， 

企 铺 类 型 资 明 符 aute 关键 字 在 实际 中 从 来 用 不 阁 . 它 通常 Hi 编 详 器 设计 者 使 用 ， 几 村 村 
记 符 与 表 的 条 目 一 一 包 胡 未 “在 进入 该 块 后 ， 白 动 分 配 存 储 ”( 与 编译 寺 静 态 分 配 或 在 堆 . 上 动 
仿 分 虎 不 同 ). 对 于 其 化 程序 员 来 说 , auto 关键 子 儿 乎 没什么 用 处 ,内 为 它 只 能 用 于 图 煞 内 部 。 
但 古 在 函数 内 部 广 明 的 数据 缺 省 就 是 这 种 分 配 。 惟一 能 用 到 auto 的 地 方 就 是 使 你 的 上 声 叫 更 加 
活 楚 整齐 ， 例 如 ; 


register int filbertl; 





auro 1nt aimord; 
statctic int hazel: 
而 不 是 : 
TreeGgiSLer irt fiikert.; 
int almond; 
static int hazel， 


过 程 活动 记录 可 能 并 不 位 于 堆栈 中 


尽管 我 们 谈 到 了 “将 过 程 活动 记录 上 计 到 堆栈 中 ”但 过 程 活动 记录 并 不 一 定 归 存在 于 堆栈 
中 。 事 实 上 ， 尽 可 能 地 把 过 程 活动 记录 的 内 容 放 到 寄存 器 中 会 使 遇 数 调用 的 速度 更 快 ， 效 果 
更 好 。SPARC 架构 引入 了 一 个 概念 ， 黎 为 “寄存 此 窗口 (register window)”，CPU 拥有 “组 宕 
存 器 ， 它 们 只 而 于 保存 过 程 活动 记录 中 的 参数 。 每 当 明 数 调用 时 ， 空 的 活动 记录 依然 压 入 到 
堆栈 中 。 当 函 数 调用 链 非 常 深 而 寄存 器 窗口 不 够 用 时 ， 寄 存 器 的 内 容 就 会 被 保存 到 堆栈 中 保 
留 的 活动 记录 空间 中 ， 以 ' 更 重新 利用 这 些 寄存 器 。 

有 些 语言 ， 如 Xerox PARC 的 Mesa 和 Cedar， 它 们 的 过 程 活 动 记录 以 链表 的 形式 分 配 在 
堆 中 。 在 PL/I 最 早 的 编译 器 由， 用 于 递 则 过 程 的 过 程 活动 记录 也 是 分 配 在 堆 中 (导致 了 性 能 
区 的 批评 ， 央 为 在 通常 情况 卜 ， 从 堆栈 中 获取 为 存 的 还 度 更 快 ，: 些 )。 
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6.7 ”控制 线程 


典 在 ， 对 于 如 何在 进程 书 文 持 不 同 的 控制 线程 (以 前 称 为 “ 轻 蜡 级 进程 ”) 是 比较 清楚 的 
了 ， 只 上 昌 简 单 地 为 得 个 榨 制 线程 分 配 不 同 的 堆栈 即 吉 。 如 果 线 程 师 数 foo0 调 用 了 bar0， 而 后 
者 多 调用 了 baz0， 测 证 程序 此 时 正 执行 其 他 的 程序 ， 它 们 中 的 每 一 个 都 天 要 和 白 己 的 堆栈 炎 保 
存 和 白 己 所 人 处 的 位 置 。 每 个 线程 的 堆栈 为 1IMb ( 当 舌 要 时 增长 )， 在 备 个 线程 的 堆栈 | 则 有 一 个 
red zone 页 。 线 程 是 一 种 非常 强大 的 编程 模 碟 ， 邮 使 在 单个 处 理 器 [也 可 以 提高 性 能 然而， 
本 晴 是 关 寺 C 诗 言 的 ， 而 不 是 关于 线程 的 。 你 应 该 参 疯 其 他 书 ， 了 解 乒 多 有 关 线程 的 细节 。 


6.8 setimp 和 longjmp 


志 寿 加 以 讨论 一 下 segmpO 和 Jongjmp0 〇 的 用 途 ， 因 为 它们 是 通过 操 级 过 程 活动 记 球 实现 
的 ,许多 程序 员 新 于 并 不 知道 这 个 强大 的 机 制 ， 因 为 它 是 C 语音 所 独 有 的 。 它 们 部 分 弥补 了 
C 族 诗 有限 的 转移 能 力 。 这 两 个 函数 功 同 下 作 ， 如 下 所 不: 

* setimp(jmp_buf 站 必须 车 先 被 调用 。 它 表示 “使 用 变量 j 记 疲 现在 的 位 置 。 冰 数 挨 加 | 
宕 。” 

， longjmpGjmp_bufj, intj) 可 以 接着 被 调用 。 它 去 未 “ 回 到 j 所 记 洪 的 位 惫 ， 让 它 看 上 大 
像 是 从 原先 的 setmpO) 函 数 返 回 一 样 。 但 是 前 数 返 回 i， 使 代码 能 赵 知 道 它 是 实 光 ;上 十 通过 
longjmpO 返 回 的 . ” 扫 不 擅 口 ? 

” 当 使 用 于 longjmpO 时 ，j 的 内 容 被 销毁 。 

setjmp 保存 了 一 份 程序 的 计数 器 和 当前 的 栈 顶 指 针 。 如 果 喜 欢 也 可 以 保存 一些 初始 值 。 
longjmp 恢复 这 些 位 ， 有 效 地 转移 控制 并 把 状态 重 置 问 保存 状态 的 时 候 。 这 究 称 作 “ 寡 于 堆 
栈 (unwinding stack)”， 因 为 你 从 堆栈 中 展开 过 程 活 动 记 录 ， 直 到 取得 保存 在 其 中 的 位 。 尺 管 
longjmp 会 导 敏 转 移 ，、 但 它 和 goto 又 有 不 同 ， 区 别 如 下 ; 

， goto 语句 不 能 跳出 他 语言 当前 的 落 数 〈 这 也 是 “Ilongjmp” 取 各 的 由 来 ， 它 可 以 紫 得 
很 运 ， 其 全 可 以 跳 到 其 他 文件 的 函数 中 )。 

“用 longjmp 只 能 跳 回 到 曾经 到 过 的 地 方 。 在 执行 setjmp 的 地 方 仍 留 有 - -个 过 程 活 动 记 
录 。 从 这 个 角度 讲 , longjmp 更 像 是 “从 何 处 来 (come from)" 市 不 是 “ 往 哪里 去 (go to)”。 longjmp 
接受 一 个 额外 的 整 型 参数 并 返回 它 的 值 ， 这 本 以 知道 是 册 longjmp 转移 到 这 里 的 还 是 从 上 - 
条 语句 执行 后 自然 而 然 来 到 这 里 的 。 

下 面 的 代码 显示 了 sejrnp( 和 longjmp() 一 例 。 

#inciude <setrJjmD ,hbh> 
jmp_buf buf; 


#include <setjmp.h> 
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第 6 章 运动 的 诗 章 : 运行 时 数据 结 格 
bananat{t) { 
Frirt[Livir parianal() no) 7 
longjmp (buf, 1;; 
1 以 下 代码 不 翁 补 十 行 */ 


prinifi"you il1 rever gee Lhics, because 1 laongijmp’c"},; 


maini 
| 
:Lisatjmo!buf:) 
princLipack in maim\n"}; 
eee f 
printf "first time through\n'},; 
banarnal); 


辆 出 结 采 如 下 : 
千 .OuL 
tirst time thxo:yl: 
im banarial) 
Rack in main 
需 必 注意 的 地 方 是 : 你 证 局 部 变量 在 longjmp 过 程 中 … 直 保持 它 的 位 的 惟一 可 靠 _ 
把 它 声 明 为 volatile《〈 这 适用 上 二 烛 些 值 在 setjmp 执行 和 Jongjmp 返 同 之 亲 会 改 伙 的 变量 
setjmp/longjmp 最 大 的 用 途 是 错误 恢复 .| 只 要 还 没有 从 所 数 中 返回 ， 一 日 发 现 -个 不 可 
恢复 的 错误 ,， 可 以 把 控制 转移 介 主 输入 循环 ， 并 从 那里 重新 开始 。 有 些 人 使 用 setjmp/longjmp 
从 “ 串 无 数 的 六 数 调用 咎 立即 返回。 还 有 - 些 人 用 它们 防范 潜在 的 危险 代码 ， 例 如 ， 当 对 下 
面 例子 中 的 可 颖 指针 进行 解除 引用 操作 时 ; 


switchisecjmp{jbuf}y; 1: 
CASE 并: 





apple - *suipicious:; 
break 了 
case 1: 
print[Ii"susnicious is & bad pointLer\n"); 
break; 
default: 
die(l"unexpected value returned by set jmp"); 


} 


这 里 需要 一 个 处 理 程序 来 处 理 段 违 规 信 号 ， 后 者 进行 相应 的 longjmp(jbuf, 1) 操 作 ， 具 体 
内 容 在 下 “- 章 解释 。setjimp 和 tongjmp 看 C++ 中 变异 为 更 普通 的 红 常 处 理 机 侧 acatch” 利 | 


“throw ”。 
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rr EN A AN 一 人 renieco 








cd BA A NN ANN 
跳 岂 已 


在 已 经 编写 好 的 程序 涯 文件 中 增加 setjmp/longjmp: 使 得 程序 在 接受 某 些 特别 的 输入 时 
会 重新 开始 ， 

在 使 用 setjimp 和 longjmp 的 任何 源 文件 中 、 必 须 包含 头 文 件 <setimp.h>。 本 

像 goto 一 样 ，setjmp 和 longjmp 使 得 称 j 朱 难以 理解 和 和 调试。 如果 不 是 出 于 特 珠 宽 些 ， 最 
好 避免 使 用 它们 。 


6.9 ”UNIX 中 的 堆栈 段 


和 UNIX 中 ， 当 进程 入 要 更 多 空间 时 ， 堆 栈 会 自动 生长 。 程 序 员 是 以 想象 堆栈 是 无 限 人 
的 。 这 是 UNIX 胜 过 其 他 操作 系统 如 MS-DOS 的 许多 优势 之 一 。 在 UNTX 的 实现 中 一 般 使 用 
某 种 形式 的 虚 氢 内存。 当 试 图 访问 当前 系统 分 配给 堆栈 的 空间 之 外 时 ， 它 将 产生 一 个 硬件 中 
断 ， 称 为 页 错误 (page faulty。 处 理 页 错误 的 方法 有 好 几 种 ， 到 决 于 对 页 面 的 引用 是 否 有 效 。 

在 正常 情况 下 ， 内 核 通 过 向 违规 的 进程 发 送 合适 的 信号 《可 能 是 段 错误 ) 来 处 理 对 无 效 
地 址 的 引用 。 在 堆栈 顶部 的 下 端 有 一 个 称 为 red zone 的 小 型 区 域 ， 如果 对 这 个 区 域 进 行 引用 ， 
并 不 会 产生 失败 。 相反 , 操作 系统 通过 一 个 好 的 内 存 块 来 增加 堆栈 段 的 大 小 。 在 不 同 的 UNIX 
实现 中 具体 细节 有 所 不 癌 ， 但 实际 效果 相似 。 附 加 的 虚拟 内 存 紧 随 当前 堆栈 的 尾部 映射 到 地 
址 空间 中 。 内 存 映 射 硬件 确 你 你 无 法 访问 操作 系统 分 配给 你 的 进程 之 外 的 内 存 。 


6.10” ”MS-DOS 中 的 堆栈 段 


在 DOS 中 , 在 建立 可 执行 文件 时 , 堆栈 的 大 小 必须 同时 确定 , 而 县 它 不 能 在 运行 时 增长 。 
如 果 你 猜测 错误 ， 需 可 的 : 礁 栈 空间 大 于 所 分 配 的 空间 ， 那 么 你 和 程序 都 会 迷失 。 如 果 设 置 了 
检查 选项 ， 就 会 收 到 STACK OVERFLOW!《 扒 栈 溢出 ) 消息 。 如 果 使 用 的 内 存 超 出 了 段 的 
限制 ， 编 译 器 也 会 发 出 这 学 一 条 信息 。 

如 果 在 一 个 单 - -的 段 中 放置 太 多 的 数据 或 代码 时 ，Turbo C 就 会 发 出 一 条 信息 ， 告 诉 你 
“Segment overflowed maximum size<lsegname> 《有 段 游 出, 超过 了 < 段 名 > 的 最 大 值 )”。 让 80x86 
架构 中 ， 段 的 最 大 限制 是 64K 字 节 。 

确定 堆 找 大 小 的 方法 痕 抉 所 使 用 的 不 同 编 详 器 而 不 同 , 在 Microsoft 编译 器 中 ,程序 员 可 
以 把 堆栈 的 大 小 作为 一 个 链接 器 参数 来 确定 。 


STACK: nnn 
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这 个 参数 告诉 Microsoft 链接 器 为 堆栈 分 氏 nnn 末节 ， 
Borland 编译 器 则 使 矿 . -个 特殊 名 字 的 变量 ; 


unciqned int _stxlen = Ox4000; xx 16K 推 栈 *: 


其 他 的 编 详 器 | 南 使 用 其 他 的 方法 来 解决 这 个 问题 。 请 参看 程序 员 参 考 指南 中 “堆栈 大 
小 ”中 详细 内 容 ， 


6.11 有 用 的 C 语言 工具 


本 蔬 包 括 了 一 些 你 应 : 玄 知 道 的 有 用 的 C 语言 工具 列表 ， 并 描述 了 它们 的 作用 ， 从 表 6-1 
至 6-4。 我 们 已 经 在 前 面 的 内 容 中 讲 到 了 其 中 一 些 于 其 ， 用 于 帮助 你 宕 拧 进 程 和 a.out 文件 的 
内 部 。 有些 工 只 是 SunOS 所 特有 的 。 本 节 提 供 了 -个 易于 阅读 的 总 结 材料 ， 告 诉 你 这 些 十 其 
Se 个 是 用 来 干什么 有 的 以 及 可 以 在 哪里 找到 它们 。 在 学 完 这 个 总 结 材 料 之 后 ， 请 接着 阅 
读 每 个 十 共 的 主 文档 , 并 在 儿 个 不 同 的 aout 中 运行 每 个 1. 具 , 可 以 使 用 “Hello World” 程序， 
也 可 以 使 用 其 他 较 大 的 程序 。 
庄 仔 细 研 究 这 些 工具 ， 如果 你 花 15 分 钟 时 间 对 每 个 工具 进行 -下 试验 , 将 来 在 解决 Bug 
问题 时 ， 它 会 大 太 节 约 你 | 鬼 时 间 。 


表 6-1 用 于 检查 源 代码 的 工具 

人 所 徐工 作 

ob 随 编 吝 器 附带 。 人 C 程序 美化 器 ， 在 源 文件 中 运行 这 个 过 滤器 ， 可 以 使 源 文件 有 标准 
的 布局 和 缩 进 粘 式 。 米 自 Berkeley 

indent 与 cb 作用 相 村 ， 来 自 AT&T 

cdeci 本 书 分 析 C 语言 的 声明 

0 随 编译 器 附带 打印 程序 中 调 月 者 /被 调用 痢 的 关系 

cscope 随 编译 器 附带 一 个 基 十 ASCII 码 C 程序 的 交互 式 浏览 器 . 我 们 在 操作 系统 小 组 中 


使 用 ， 用 于 检查 头 文件 修改 的 效果 。 它 提供 了 对 下 列 问题 的 快速 答 
案 : “有 多 少 命令 使 用 了 libthread? ”或 “阅读 了 kmem 的 所 有 六 


件 是 哪些 ” 
ctags usribin 创建 一 个 标签 文件 ， 供 vi 编辑 器 使 用 。 标 签 文件 能 加 快 检查 程序 源 
文件 的 速度 ， 方 法 是 维护 :个 态 ， 里 面 有 绝 大 多 数 对 象 的 位 置 
lint 随 编 详 器 附带 C 程序 检查 器 
SCCS usriccs/bin 源 代码 版 本 控制 系统 
vgrind /usr/bin 格式 器 ， 用 于 打印 漂亮 的 C 列表 





医生 可 以 使 用 X 射线 、 声 谱 仪 、 内 罕 镜 和 探查 术 来 查看 病人 的 身体 内 部 。 这 些 上 而 这 些 
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.有 具 就 是 软件 世界 的 X 射线 . 


表 6-2 


nm 


sirings 


SUITL 


表 6-3 
T 只 


trUNSS 


ps 


elrace 


debugger 


file 


表 6-4 
.| 有 具 
collector 
analyzer 
gprof 
prof 
tcOY 


time 


192 


用 于 检查 可 执行 文件 的 工具 


位 开 何 处 所 做 .1 作 
fusriccstbin 昌 标 代 码 反 洒 纺 工具 
tusticestbin 打印 动态 链接 信息 
Asrbin 打印 文件 所 需 的 动态 
Ausrices/hin 打印 目标 文件 的 符号 下 
usrfbin 查看 嵌入 十 “ 进 制 文件 由 的 字符 串 。 放 于 查看 ”… 进 制 文件 可 能 产 牛 
的 错误 信息 、 内 党 文件 名 各 有 时 候 ) 符 苇 名 或 版 本 和 版 权 信 忠 
fusribin 打印 文件 的 检验 和 与 程序 块 计数 。 岂 答 下 面 这 样 的 问题 ， “这些 可 


执行 文件 是 同一 版 本 的 码 ? ”“ 传 输 足 省 成 功 ?" 





帮助 调试 的 工具 
位 于 何人 所 做 工作 

Ausrbin trace 的 SVr4 版 本， 这 个 工具 打印 可 执行 文 作 所 进行 的 系统 调用 。 
它 可 用 于 查看 一 进 制 文件 由 在 十 什么， 为 信 么 阻塞 或 者 失败 ， 这 将 
非常 有 用 

Ausrrbin 显示 进程 的 特 钼 

随 编 译 卓 附带 修改 你 的 源 文件 ， 文 件 执行 时 按 行 打印 。 是 个 对 小 程序 十 常 有 有 川 
的 工具 

随 编译 器 附带 变 互 式 调 试 器 

jnsrbin 告诉 你 “个 文件 包含 的 内 究 5 如 可 执行 文件 、 数 据 ，、ASCI、shell 


script、archive 等 》 











性 能 优化 辅助 工具 

位 十 何 处 所 做 .和 作 
随 编译 器 附带 (SunOS 独 有 ) 在 调试 器 控制 下 收集 运行 时 性 能 数据 
随 编译 喘 附 带 (SunOS 独 有 ) 分 析 山 收集 的 性 能 数据 
fusr/cestbin 显示 调用 峡 配 较 数 据 ( 确 定 计 算 密集 的 陪 数 》 
fusriccs/bin 针 示 每 个 程序 所 消耗 时 间 的 广 分 比 
随 编 详 器 附带 显示 每 条 语句 执行 次 数 的 计数 确定 “个 函数 中 计算 究 集 御 环 ) 
tusr/bin/time 显示 程序 所 使 用 的 实际 时 间 和 和 CPU 时 间 
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如 果 你 工作 十 操作 系统 的 内 核 模式 ， 则 无 法 使 用 绝 大 多 数 运 行 时 上 共 ， 因 为 内 核 并 不 像 
用 户 进 程 那 样 运行 。 可 以 党 用 编译 时 工具 如 lint， 但 除 此 之 外 我 们 内 能 使 用 石 妃 和 燃 傣 了 : 
将 有 有 序 模式 放 入 内 存 中 ， 沪 看 它们 何 时 被 获 六 (最 常 使 用 的 屿 个 是 上 六 进 制 常 芋 deadbeef 和 
abadcate )， 使 用 pirntf 或 茯 似 的 半数 并 记录 跟踪 信息 . 





| 软件 信条 


Vr IIF A a NA dm eT TP EEE TE Fb PTAA EB OW WN re A abe A eve 


用 grep 调试 内 核 


当 内 核 检测 到 “不 会 出 现 ” 的 情况 时 、 它 就 会 “惊慌 失措 ”， 引 起 突然 停止 。 例 如 当 
它 寻 找 一 些 具体 数据 时 ， 却 发 现 了 一 个 pull 指针 。 由 于 它 无 法 从 这 种 情况 中 恢复 ， 最 安全 的 
方法 就 是 在 数据 消失 前 中 断 处 理 器 。 为 解决 内 核 的 “ 惊 懂 ” 问 题 ， 首 先 必 须 考 虑 有 哪些 事情 
有 可 能 吓 坏 操作 系统 。 

RAR 非常 难以 被 发 现 。 其 症状 是 内 核 的 内 存 偶尔 
会 被 履 关 ， 这 会 使 系统 “' 京 慌 ” 

我 们 队伍 中 的 两 个 顶尖 工程 师 着 手 处 理 这 个 问题 ， 他 们 注意 到 总 是 一 个 内 看 块 的 前 19 
个 字 节 被 涂抹 ， 这 是 一 个 站 寻常 的 偏 移 量 ， 不 党 别处 出 现 的 2，4，8 等 常见 值 ， 其 中 一 个 工 
程 师 灵 机 一 动 ， 把 这 个 篇 注 量 作为 目标 在 Bug 中 进行 进行 跟踪 ， 他 建议 用 内 核 调 试 器 kadb 
来 反 汇 编 内 核 二 进 制 文件 的 映像 ( 花 了 一 个 小 时 时 间 ) ， 将 结果 输出 到 一 个 ASCII 文件 中 ， 
| 

这 些 指 令 中 的 其 中 一 个 肯定 是 引起 问题 的 根源 ， 

A 现在 ， 他 们 对 问题 出 在 
什么 地 方 已 经 比较 明确 了 ， 现 在 要 做 的 就 是 找 出 它 ， 进 一 步 努力 之 后 ， 他 们 终于 找到 了 罪魁 
祸首 : 位 于 一 个 进程 控制 结构 的 竞争 条 件 。 它 的 用 意 是 一 个 线程 在 其 他 线程 {调用 了 该 线程 】 
真正 完成 工作 之 前 先 在 内 寺中 作 个 标记 ， 以 便 以 后 返回 系统 。 结 果 : 内 核 内 存 分 配器 把 这 块 
内 存 分 配给 了 别人 ， 但 进 湿 控 制 块 仍 以 为 它 还 保留 有 这 块 内 存 ， 所 以 向 其 写 入 ， 这 样 就 导致 
了 这 个 极 难 发 现 的 Bug。 

用 grep 来 调试 操作 系统 内 核 一 一 一 个 非 与 寻常 的 概念 。 有 时 候 甚至 连 源 代码 工具 都 可 以 
帮助 解决 运行 时 间 题 ! 


mm EY EE Raed EEE edb TT EE er herbert A A ya rr 


在 讨论 这 些 有 用 工 共 的 同时 ， 表 6-5 询 出 了 -一些 识别 Sun 系统 确切 配置 的 方法 。 然 而 ， 
除非 你 在 实 幅 中 使 用 它们 ， 省 则 它们 对 你 不 会 有 多 大 帮助 
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类 6-5 帮助 你 识别 硬件 的 工具 
识别 什么 与 型 输出 

内 核 体系 sunde jusrkvmyarch ~k 
年 何 用 于 OS 的 补丁 木 安 装 补 本 Ausrfbinfshowrev —p 
匣 种 硕 件 许多 usrisbin/prticont 
CPU 时 钟 频率 40MHz: 处 埋 跨 fusr/sbin/psrinto -v 
主机 ID 55417€fe /usriucb/hostid 
内 存 32Mb 在 开机 时 局 未 
序列 卸 4290302 在 开机 时 府 示 
ROM 版 本 2.4.1 让 升 机 时 局 不 
安装 的 磁 得 198Mb 伐 盘 Ausribin/df -FE ufs -k 
父 换 区 40Mb /etciswap ~s 
以 太 网 地 起 8:0:20,1:8c:60 fustfsbimifconfig -a 兴 太 网 地 尼 被 建立 到 机 器 中 
中 地 址 le0=120.144.248.36 jusrisbinfitconfig -a IP 地 三 被 建立 到 网 络 由 
浮 点 数 硬 件 FPU 的 频率 显示 fpversion 随 编 译 器 附带 


为 38.2MHz 





6.12 轻松 一 下 一 一 卡耐基 - 梅 隆 大 学 的 编程 难题 


几 人 年 前 ,卡耐基 - 梅 隆 人 学 (CMU) 的 计算 机 科学 系 自 - 个 常规 性 的 小 型 编程 竞赛 ， 参 赛 对 
象 是 出 入 学 的 妍 究 汪 。 竞 赛 的 目的 是 让 这 些 新 的 醋 究 人 员 得 到 一 些 拓 十 计算 机 科学 系 的 直接 
经 验 ， 并 让 他 们 展示 自己 的 强人 潜力 。CMU 在 计算 机 领域 的 研究 历史 悠久 ， 可 以 追溯 到 计 
算 机 的 先 虹 时 代 ， 它 在 这 个 领域 所 取得 的 成 就 可 以 说 是 非 同 几 响 ， 所 以 ， 对 于 CMU 举办 的 
编程 竞赛 ， 其 水 准 可 想 而 知 。 

比赛 的 形式 每 年 部 本 一 岸 ， 其 中 有 - -年 非常 简单 。 参 赛 者 必须 污 入 -个 文件 《文件 的 内 
容 是 些 数 值 )， 并 打印 这 些 数 值 的 平均 数 。 只 有 两 个 规则 ; 

1. 程序 的 运行 速度 要 尽 可 能 地 快 。 

2. 程序 必须 用 Pascal 或 C 编写 。 

参赛 选手 的 程序 集中 之 吾 山 一 名 系 上 作 人 员 分 批 上 交 。 学 后 们 可 以 白 愿 上 交 尽 可 能 多 的 
作品 ， 这 可 以 鼓励 非 确 定性 随机 算法 《就 是 猜测 某 些 数据 集 的 特征 ， 利 用 猜测 结果 获得 及 可 
能 快 的 效率 ) 的 使 用 。 决 定性 的 规则 是 ; 运行 时 间 最 短 的 程序 将 获得 优胜 。 
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这 些 研究 生 们 纷纷 钻 过 各 个 角落 ， 开 始 折腾 各 种 各 样 的 程序 。 他 们 中 的 绝 人 多 数 邦 准 备 
了 3 到 4 个 程序 参加 竞赛 , 存 此 , 读者 们 也 可 以 想起 有 什么 样 的 技巧 可 以 使 程序 运行 得 网 快 


PAN TAR ERNE FE TE OE A NN Nm 


编程 挑战 
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上 怎 样 突破 速度 限制 


想象 一 下 ， 假 如 你 接 到 一 个 任务 ， 要 求 读 入 一 个 内 容 是 10 000 个 数值 的 文件 ， 并 计算 这 
些 数值 的 平均 数 。 你 的 程序 的 运行 时 间 必 须 尽 可 能 地 短 . 
你 会 采用 什么 料 的 编程 和 编译 技巧 来 提高 速度 ? 


NE re A ON EO A rn 





人 多 数 人 者 狂想 最 人 的 赢家 - … 定 采用 了 代码 优化 措施 ， 不 管 是 最 式 地 在 代 贷 中 使 咱 ， 战 
二 通过 止 确 设 管 编译 器 选 鼎 隐 式 地 使 用 。 标 准 的 代码 优化 技巧 包括 :消除 循环 、 也 数 代 代 就 
地 扩展 、 公 上 子 表达 式 消除 、 改 进 寄 存 嚣 分配、 省略 运 行 时 对 数 给 边 异 的 检 栅 、 御 环 不 变 盟 
代码 移 动 (loop-invariant code motion)、 江 作 符 长 度 渭 减 “把 指数 据 作 转变 为 乘法 操作 ， 把 乘 
法 操作 转变 为 移 位 操作 战 加 法 操作 等 ) 等 。 

数据 文件 大 约 包 含 了 .0 000 个 数值 ， 假 定 读 入 和 处 埋 每 个 数 需 要 一 毫秒 (当时 的 芭 统 区 
不 多 就 是 这 个 速度 )， 最 快 的 程序 也 要 用 10 秒 左 在 ， 

实际 结果 非常 令 人 大 吃 怀 。 其 中 最 快 的 一 个 程序 ， 操 作 系统 报 告 朋 时 为 一 3 秒 。 确实 如 此 
一 一 优胜 程序 的 运行 时 间 是 负数 ! 第 二 快 的 程序 大 约 用 了 几 童 秒 ， 而 排名 第 一 的 作品 恰好 比 
预期 的 10 秒 稍微 少 一 点 。 显然 ， 获 胜 者 在 编程 中 作 了 况 ， 丛 他 是 怎样 作 刺 的 呢 ? 评委 们 在 对 
优胜 程序 进行 仔细 审查 后 ， 答 案 揭 晓 了 。 

这 个 运行 时 浊 为 负 的 程序 充分 利用 了 操作 系统 。 程 序 员 知 道 进程 控制 块 相 对 于 堆 校 底部 
的 存储 位 曾 ， 他 用 一 个 指针 米 访问 进程 控制 氛 ， 并 几 一 个 非常 大 的 值 神 盖 “CPU 已 使 用 上 时间” 
字段 。 操 作 系统 未 曾 想到 CPU 时 间 会 有 如 此 之 大 ， 央 此 错误 地 以 一 进 制 补 徊 方案 把 这 个 非 


爹 于 都 个 费时 仅 几 翔 秒 的 业 牢 程序 得 主 同 样 狐 消 ， 他 上 用 的 方法 有 所 不 癌 。 他 使 用 的 起 竞 
争 规则 而 不 是 怪异 的 编码 。 他 提交 了 两 个 不 同 的 程序 ， 其 中 一 个 污 入 数据 ， 咱 赴 常 的 方法 计 
算 平均 值 ， 并 将 答案 写 入 一 个 文件 。 第 .个 程序 绝 大 部 分 时 间 都 处 于 睡眠 状态 ， 它 得 随 儿 秒 
醒 来 一 次 检查 答案 文件 是否 己 存在， 如 果 己 经 存 作 ， 就 打印 其 结 末 。 第 二 个 程序 总 共 只 占用 
了 几 至 秒 的 CPU 时 间 。 由 二 参赛 者 允许 递交 多 件 作 品 , 所 以 这 个 用 时 极 少 的 程序 就 把 亿 推 革 
丁 业 车 的 位 置 。 


， 这 是 一 种 对 规则 的 臭名 蜡 著 的 滥 帮 ， 类 似 于 阿根廷 是 球 巨星 纪 拉 名 钠 自 1986 年 出 界 杯 川上 矢 打 入 英 概 苦 队 ” 球 的 册 个 “十 帝 
之 卑 " ， 
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深 军 作曲 所 花 的 时 虞 比 预 想 的 最 小 上 时间 还 要 稍 少 ~- 些 。 访 程序 的 构思 弄 为 周详 ， 程 学 员 
弹 粮 疯 虑 ， 用 优化 机 占 代 绍 米 解 决 问题 ， 并 把 指令 作为 整 弄 数组 存储 在 程序 吊 ， 由 于 在 程序 
中 纹 盖 堆栈 上 上 鸣 这 加 地 址 足 非 党 穿 归 鬼 “正如 Bob MorisJr.1988 生机 [nternet 电 下 让 所 假 的 
烛 样 2， 所 oe 子 可 以 跳 苇 到 这 个 整 型 数组 并 这 条 执行 这 些 指令 : 所 中 洪 的 时 间 旭 实 反 遇 了 了 这 
些 指 令 解 冰 问 题 的 时 间 。 


当 这 巷 策 略 被 所 圳 后， 复 动 了 全 系 。 有 此 专家 链 成 对 获 几 着 进行 严 万 批评 ， 格 年 轻 教 
授 则 相反 ， 他 人 科 建 议 给 他 们 额外 的 奖励 芭 表 彰 但 们 的 天 村 ， 最 后， 发 方 达成 受 胁 。 既 没有 有 自 
奖 ， 也 来 半 他 们 进行 毯 嘲 ， 结 果 不 了 了 之 念 人 是 诡 的 是 .这 个 竞赛 成 了 经 列 感 情 的 牺 犊 由 。 


从 此 以 后 ， 这 个 比赛 下 未 举行 ， 


6.13 ”只 适 用 了 于 高 级 学 员 赔 读 的 材料 


对 符 考 之 语 : 司 羽 把 省 - 纺 代码 骨 入 到 CC 代 档 中 。 这 道 还 只 用 十 深入 氛 作 系统 核心 正和 依 
赖 机 器 的 任务 . 例如 设 闯 打 个 特别 的 家 存 器 ， 把 系统 的 状 访 从 符 霸 员 模式 转变 为 用 户 模 式 . 
现在 ， 我 们 把 ~ -条 no-op 或 其 他 指 今 ) 插入 他 使 用 SunPro SPARCompiler 的 C 半数 中 :; 

Pananaii) Rs 

下 二 是 如 何在 PC 中 使 用 Microsoft C 区 六 并 编 语 六 指令 : 


an mow eft, 7 
aanm row dl, 43h 


中 以 在 汇编 代 全 前 鞠 以 关键 学 “asm*”， 也 可 以 内 使 用 该 关键 学 一 深 ， 拱 所 三 的 半 . 编 代 
位 放 六 一 对 花 扩 号 内 ， 如 下 : 


网 谋 过 并 不 会 对 代 妈 作 多 少 检 贷 ， 所 以 很 容易 创建 崩 泪 的 程序 .个 这 是 种 学 习 革 种 机 
占 指 令 集 很 好 的 实践 方法 。 请 看 - -下 SPARC 结构 手册 、 洒 编程 序 于 册 大 部 分 几 -于 讲述 详 
法 利 指导 ) 和 上 个 SPARC 销售 虎 所 提供 的 数据 书籍, 如 | Cypress Semiconductor 的 SPARC RISC 
User’s Guide. 
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对 内 存 的 思考 


WE NN NA AD 0 C7 III EROTIC OI APRAI IIE ERI YA NN TY I FR -0 LET. 


大 师 向 他 的 一 位 新 学 生 解 释 道 的 本 质 。 

“ 道 蕴 含 于 所 有 的 软件 中 ， 不 管 它 们 是 多 么 微不足道 ， ”大 师 说 道 。 

“那么 ， 道 是 否 存 在 于 手持 式 计算 器 中 ? ”学 生 问 道 

“是 的 。” 大 师 回 答 ， 

“那么 道 是 否 存 在 于 :视频 游戏 中 ? ”学 生 继 续 问 ， 

“是 的 ， 即 便 它 是 一 个 视频 游戏 ，” 大 师 回 答 。 

“那么 ， 道 是 不 是 存在 于 PC 的 DOS 上 ?” 

大 师 咳 嗽 了 几 声 ， 微 -化 移动 了 一 下 位 置 ， 答 道 : “ 它 可 能 会 存在 二 名 按 的 活动 记录 中 . 
今天 的 课 就 到 此 为 止 。?” 


-~ Geoffrey James, The Tao of Progranunino 


本 章 从 讨论 Intel 80x&6 处 理 器 系列 (IBM PC 的 核心 ) 的 内 存 体 系 开始 ,将 PC 撞 内 存 模 
型 与 其 他 系统 中 的 虚拟 为 季 横 型 进行 了 对 比 。 程 序 黄 如 果 对 内 存 体系 有 一 个 充分 的 了 解 ， 将 
有 助 于 他 们 理解 C 语言 中 的 一 些 约 定 种 限制 ， 


7.1 JIntel 80x86 系列 


现代 的 Intel 处 理 器 可 以 局 渭 到 最 早期 的 Intel 芯片 : 随 着 顾客 对 芷 片 的 使 用 越 米 越 复杂 
他 们 对 蕊 片 的 此 求 也 越 来 证 高 。Iintel 总 起 能 够 及 时 提供 身后 兼容 的 处 理 器 。 可 兼容 性 使 用 户 
更 容 切 升级 到 新 的 芯片 , 企 它 也 闫 电 限 制 了 芯片 的 革新 .现代 的 Pentiom 处 理 器 是 15 年 前 Intel 
8086 处 理 崔 的 直接 后 代 ， 它 存在 着 许多 架构 上 的 不 规整 性 ， 日 的 就 是 为 了 与 8086 保持 向 后 
兼容 《在 8086 上 编 详 芍 程序 对 以 在 Pentiaum 上 运行 )， 员 于 Intel 在 保持 蕊 片 束 究 性 的 同时 不 
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得 不 限制 - 些 单 新， 所 以 有 些 估 不 客气 地 评论 “Intel 在 保持 向 后 兼容 性 的 同时 落伍 三 
《 见 图 7-1)。 


总 技术 帘 航 
人 4004 4 位 | 
| 8008 8 位 人 


8085 8 位 
oa | 8086 16 位 
1983 | #0286 32 位 
1993 


P6 64 ay? 


技术 宽 破 


图 7-1 Inte] 80x86 家 族 : “在 保持 向 后 菲 容 时 落后 了 ?” 


Intel 4004 是 一 个 4 位 的 微 控制 器 , 它 是 1970 年 Intel 为 满足 :个 单独 的 顾客 Busicomt - 
家 日 本 计算 器 公司 ) 的 特殊 需要 而 开发 的 。Intel 的 说 计 工 程 师 的 想法 是 生产 -. 种 通用 日 的 的 
可 编程 必 片 ， 而 不 是 遵循 当 封 为 每 个 顾客 量 身 定做 的 则 辑 规则 、Intel 原先 设想 售 出 几 鼎 块 这 
样 的 芯片 , 但 通用 日 的 设计 很 快 显示 了 已 大 的 应 用 潜力 ,4 位 的 字 长 实在 太 小 了 , 所 以 在 1972 
和 牛 4 月 ,8 位 的 8008 芯片 诞生 了 。 两 年 后 ，8080 芯 斤 诞生 了 ， 这 是 第 - - 片 性 能 强大 到 可 以 称 
其 为 微 处 理 器 的 艺 片 。 它 包含 完整 的 8008 指令 集 ， 并 增加 了 30 条 自己 的 指令 ， 从 而 开创 了 
一 个 沿用 至 今 的 传统 ,如 果 涪 4004 是 一 块 使 Intel 开创 事业 的 芯片 ,那么 8080 就 是 一 块 为 Intel 
带 来 财富 的 芯片 ， 它 使 Intel 的 年 度 营业 额 突破 了 10 亿美 元 ， 并 高 居 财 富 500 强 的 有 前列 。 

8085 处 理 器 充分 利用 了 芯片 整合 技术 , 它 将 三 块 候 片 组 合成 一 块 ,在 本 质 上 , 它 是 把 8080 
处 理 右 、8224 时 钟 骤 动 器 和 8228 控制 器 整合 到 一 块 必 片 上 。 有 虽然 它 内 部 的 数据 总 线 宽 上 度 仍 
然 是 8 位， 但 它 使 用 了 16 位 的 地 址 总 线 ， 所 以 能 够 访问 256 也 就 是 64KB 的 内 存 。 

8086 处 理 器 于 1978 年 诞生 ， 它 对 8085 作 了 改进 ， 允 许 16 位 的 数据 总 线 和 20 位 的 地 址 
总线 ， 可 以 访问 多 达 1MB 的 内 存 〈 这 在 当时 是 - -个 非常 惊人 的 数字 )。 这 块 臣 片 采 用 了 一 个 
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北 比 寻常 的 设计 决定， 它 遂 过 重 瞪 两 个 16 和 位 的 宁 来 形成 20 位 的 地 十 ， 击 不 是 授 过 简单 地 连 
接 两 个 学 米 形 成 32 位 的 地 址 《 见 图 7-2)。8086 在 指令 集 -… 级 .|. 干 8085 不 茹 容 ， 但 污 编 程序 
宏 (assembler macro) 可 以 径 容 易 地 把 原来 的 程序 转移 到 新 的 芯片 上 

8086 太 采 用 的 异乎 常规 的 守 址 策略 使 8085 上 的 代码 移植 到 8086 更 加 简单 。 当 某 个 段 寄 
存 器 装 入 一 个 辐 定 的 值 后 ， 便 无 须 再 理 皮 它 们 ， 直 接 使 用 8085 的 16 位 地 址 就 可 以 了 ， 设 计 
队伍 据 兰 了 把 两 个 宁 连 接 在 … 起 形成 地 址 的 想法 , 这 个 方法 可 以 产生 32 位 地 址 ,村 以 访问 的 
光疗 多 达 4GB〔 这 在 当时 是 一 个 不 可 想象 的 天 多 数字 )。 

既然 确立 了 这 个 基本 的 地 址 模 规 ， 后 续 的 80x86 人 处理 器 不 得 不 延续 这 种 化 法 ， 洁 则 就 全 
导致 不 兼容 性 。 如 果 说 8080 是 一 块 使 Intej 足 员 家 门生 列 的 芯片 ， 那么 8086 就 是 一 块 使 Intel 
你 持家 门 位 置 的 芯片 ,我 们 呆 能 永远 不 会 知道 BM 站 1979 年 选择 fntel 的 8088( -种 与 8086 
同 代 的 8 你 蔚 片 》 作 为 它 新 上 发 的 PC 的 CPU 的 确切 原因 。 从 技术 土 说 ， 妆 时 有 许多 公司 时 
以 提供 出 为 出 色 的 方案 , 要 Motorala 各 National Semiconductor。 i 十 选 接 了 了 inte] 的 芯片 ,[BM 
福 助 Iniel 在 接 下 米 的 20 多 午时 财源 滚滚 ， 就 像 IBM 选择 了 Microsoft 的 MS-DOS 作为 PC 
的 操作 系统 从 市 使 Microsoft 飞黄腾达 样 。 只 有 谤 制 意 味 的 是 ，1993 年 8 及，Intel 的 股票 
市 值 达到 了 266 亿美 元 ， 赵 过 了 TIBM 的 245 亿美 过 ， 有 从 良 皮 化 JBM 成 为 美国 市 值 最 高 的 电 


16 和 位 从 吉 下 .. 3 3 4 3 


15 0 

十 | ， 4 4 4 
19 0 
| ， 了 :| 


第 一 个 16 位 值 可 称 为 “ 偏 称 量 "， 第 .个 16 位 字 经 过 移 位 后 称 为 “ 段 "， 8086 点 片 
有 由 个 段 浓 在 绒 ， 用 于 存储 段 赐 址 的 值 ， 并 能 自动 进入 移 位 和 扳 法 操作 来 记 涉 20 位 的 地 
抓 。 

8086 有 代 双 宵 疗 器 C8S， 数 据 寄 存 器 DS 利 推 厂 窒 存 跨 SS， 分别 存放 代 模 段 ， 数 据 段 
利 堆 栈 段 的 首 款 址 , 另外 还 有 … 个 附加 段 ES 从 编译 者 作 省 的 角度 再 , 这 些 是 卡带 有 出 的 ， 


绍 这 物 位 的 6 位 柱 





旗 沾 - 个 2 全 的 地 址 


网 7-2 Intel 8086 媳 何 形成 内 存 地 址 


Intel 和 Microsoft 任 借 其 独家 经 营 钓 产品 , 获得 了 近 远 超出 其 贡献 的 暴利 ,成 为 新 的 IBM。 
IBM 仍 在 绝望 地 挣扎 , 试图 恢复 自己 以 前 的 地 位 。 它 推出 PowerPC， 企 图 打破 Intel 在 便 件 上 
的 芍 断 ， 同 时 推出 OS/2 操作 系统 ， 试 网 动摇 Microsof 在 软件 上 的 统治 。OS/2 失败 无 疑 ， 但 
断定 PowerPC 的 尼 运 则 为 时 尚 早 。 

用 十 最 初 的 IBM PC 的 8088 处 更 回 只 是 8086 的 一 种 廉价 版 椒 ， 它 允许 当时 大 明 存 在 的 
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支持 8 位 的 世族 继续 合用， 比 后 ， 对 80x86 处 理 器 的 升级 部 体现 在“ 虹 小 、 更 快 、 晶 使 福 以 
及 更 多 的 指令 ”上 。80186 走 的 就 是 这 条 路 ， 增 加 了 10 条 并 不 是 很 间 些 的 指令 80286 左 不 
多 丈 丰 80186 【只 是 内 内 了 一 些 匠 不足 道 的 外 设 端口 文 持 六 但 它 第 一 次 诚 导 扩展 内 仓 地 址 空 
加 。 它 把 内 存 探 制 器 移 到 处 理 器 芯片 的 外 击 ， 并 提供 了 种 野心 勃勃 的 内 存 横 世 ， 称 为 虚拟 
模式 (virtual mode)。 人 在 虚拟 模式 中 ， 段 寄存 器 并 不 与 偏 移 地 址 相 加 ， 向 是 为 一 个 存放 实际 段 
好比 的 志 查 供 索 引 。 这 种 址 直 模 式 也 被 称 作 保护 横 式 (protected mode)， 它 依然 是 16 位 的 。 
MS-Windows 使 用 286 的 保护 模式 作为 它 的 标准 地 雪 - 模 式 ， 

80386 在 80286 的 基础 上 增加 了 项 种 新 的 地 址 机 式 :32 总 的 保护 模式 利 虚拟 的 8086 模式 ， 
Microsoft 的 旗舰 产品 Windows NT 操作 系统 以 及 增强 模式 二 的 Windows 帮 末 咱 了 32 位 的 保 
护 模 江 。 这 点 是 为 什么 Windows NT 至 少 第 此 386 才能 运行 的 序 因 ， 芝 一 种 内 存 模 式 ， 虑 拟 
的 8086 模式 ， 可 以 创建 一 各 内存 空间 为 1MB 的 8086 虚拟 机 ,， 几 个 虚拟 机 本 以 同 对 运行 ， 
从 而 文 择 MS-DOS 的 虚拟 多 任 荔 系统 。 它 们 中 的 位 一 个 部 认为 自己 运行 于 白 己 的 8086 处 再 
右上 。 此 时 ， 称 应 该 能 够 不 旬 ， 册 十 地 初 内 存 地 上 址 策略 的 限制 ， 处 理 昌 益 增长 的 内 存 空间 的 
需 些 将 是 - 件 琅 手 的 于 休想 得 没 销 !1 对 村 编写 编 详 秦 相应 用 程序 而 辣 ，80x86 是 :个 充满 
忆 礁 利 失 折 的 点 构 。 

上述 所 有 这 些 处 理 跨 邦 吓 以 附加 协 处 理 器 ， 遂 常用 于 实现 浮 点 数 的 健 件 点 持 ，8087 种 
80287 协 处 理 器 是 一 样 的 , 惟一 的 区 别 是 287 可 以 和 286， 样 扩展 对 内 存 的 访问 : 387 可 以 使 
用 和 386 一 - 样 的 模式 访问 内 存 ， 但 它 同 时 增加 一些 内 窒 的 高 级 功能 . 


| 元 软件 信 条 
人 A Se 


选择 IBM PC 的 组 件 


JBM 在 PC 上 所 做 的 部 分 决定 【也许 是 大 部 分 决定 ) 显然 是 出 自 非 技术 的 背景 ， 在 决定 
采用 MS-DOS 之 前 , IBM 安排 了 一 个 会 议 , 与 Digital Research 公司 的 Gary Kildall 商讨 CPIM 
操作 系统 的 事宜 ， 就 在 会 议 准 行 的 当天 ， 出 现 了 人 们 传说 中 的 故事 : 由 于 天 气 非常 好 ，Cary 
Kildall 决定 改 坐 自己 的 私人 飞机 与 会 , 结果 误 点 . IBM 的 经 理 们 可 能 对 长 时 间 等 待 颇 感 恼火 ， 
便 转 而 与 Microsoft 拆 努 达成 了 协议 。 

Bill Gates 当时 刚 从 Seatlle Computer Product 公司 购买 了 QDOS', 对 它 稍 作 整理 后 , 更 名 
为 MS-DOS。 接 下 来 的 故事 ,都 已 是 人 们 津津 乐 道 的 历史 凌 故 。IBM 很 高 兴 , Inte] 也 很 高 兴 ， 
Microsoft 则 是 非常 非常 高 兴 ，Digital Research 自然 不 会 愉快 。 数 年 以 后 ，Seattle Computer 
Products 意识 到 自己 放 走 了 一 个 有 史 以 来 销量 最 大 的 计算 机 程序 后 ， 自 然 也 不 会 渝 快 ， 他 们 
仍 保留 了 一 个 权利 ， 就 是 他 们 在 销售 硬件 时 可 以 同时 销售 MS-DOS。 这 就 是 为 什么 过 去 你 能 


” 从 文学 效果 1 说 . 它 才 未 “Quick and Diry Operating System 快 囊 向 脐 肝 的 如 伟 系 统 》”。 
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看 到 一 坚 出 自 Seattle Computer Products 的 MS-DOS 的 原 加. 它们 被 消 薪 地 附 在 显然 已 经 法 用 
的 Jntci 已 片 产 品 土 ， 从 而 “庄严 ”地 左 行 他 们 与 Microsoft 所 达成 的 协议 ， 

不 要 为 Seattle Computsr Products 感 到 太 计 后 一 一 他 们 的 QDOS 本身 在 很 大 墟 度 也 是 基于 
Gray Kildall 的 CPM， 而 Gray Kildall 似乎 更 朴 训 于 飞行 ，Bill Gales 后 来 用 销售 软件 的 利润 
购买 了 一 辆 性 能 出 众 、 快 如 闪 电 的 保时捷 959 跑车 ， 花 了 75 万 美元 . 但 在 进入 美国 海关 时 却 
出 了 问题 ， 保时捷 959 无 法 在 美国 驾驶 ， 因 为 它 没有 通过 美国 政府 规定 必须 进行 的 防 挡 性 浏 
试 ， ee 1 人 兰 的 一 个 仓库 里 ， 从 来 没有 驾驶 过 ， 这 大 概 是 Bill Gates 

80486 大 一 种 经 过 系 许 包装 的 80386. 它 的 速度 更 快 “ 些 , 因为 总 线 忠 入 元 许 安装 辕 处 型 
Re 汪汪 地 增 
山 了 一 些 指令 ， 并 在 处 理 器 内 部 集成 了 cache〔 员 速 的 处 理 器 内 存 )， 其 余部 分 的 性 能 其 示 主 
要 诺 引 功 寺 人 它 ; 然而 便 到 了 20 攻 纪 90 年 代 ， 在 经 过 站 人 的 技术 ， 此 新 和 各 让 椒 二 的 全 论 后 ， 
Intel 将 它 的 新 必 片 命名 为 Pentium， 掉 不 是 80586。 它 中 加 快速 、 殉 斩 量 页 ， 赤 持原 先 的 所 丰 
指令 ， 并 增加 了 些 新 指令 可 以 预料 80686 将 会 史 快 ， 册 量 袜 ， 并 证 提供 了， 此 额外 的 指 
令 。 激 屿 Intel 连续 推出 新 芯片 的 格 交 就 是 “ 昌 么 更 快 、 相 么 火 庆 ”而 他 们 号 是 依 条 这 个 格 
上 生存 的 ， 下 如 我 下 返航 年 岂 在 退休 请 尝 在 轮 格 上 时 曾 说 过 的 灶 祥 “对 焉 记 记 历史 的 人 注定 
会 出 现 产 重 的 六 后 非 穿 问题 、 克 其 当 季 作 改 变 内 存 的 地 吉 模 并 或 机 器 架构 的 字 长 时 


7.2 Intel 80x86 内 存 模型 以 及 它 的 工作 原理 


ee 段 (segmenbD 这 个 木 诸 全 少 有 了 两 种 不 同 的 会 义 了 上 其实 还 存在 

三 种 含义 ， 它 跟 操 作 系 统 的 内 存 管理 有 关 ): 

在 UNIX 中 ， 段 就 是 一块 以 … 进 制 形式 出 现 的 相关 汶 容 。 

在 Intel 80x86 内 存 横 型 中 ， 段 是 内 存 横 型 设计 的 结果 ， 在 80x86 的 内 存 模 型 巾 ， 各 处理 
器 的 地 址 空间 并 不 一 致 “四 为 要 保持 兼 容 性 )， 介 它们 都 被 分 割 成 以 64K 为 单位 的 区 域 ， 每 
个 这 样 的 区 域 便 称 为 段 。 

作为 80x86 内 存 模型 最 基本 的 形式 , 8086 中 的 段 是 - 岂 64K 的 内 存 区 域 , 山 个 段 寄 存 
器 所 指向 。 内 存 地 址 的 夫 成 经 过 是 ， 取 得 段 寄 在 器 的 值 ， 左 移 4 位 〈 相 当 于 乘 上 上 16)》， 或 者 
换 种 思路 ， 把 段 寄 存 器 的 值 看 成 是 20 位 的 ， 也 就 是 存储 的 厂 边 扩充 4 个 0。 

然后 就 是 16 位 的 偏 移 : 也 圳 -， 它 表 不 段 内 的 地 址 ， 如 果 拒 段 寄 存 器 的 值 《经 过 移 位 } 加 上 
偏 移 地 址 ， 就 得 到 最 终 的 地 址 。 注意: 止 如 两 个 数 加 起 米 等 于 24 的 例子 有 很 多 的 贞 样 ,不同 
的 段 地 址 加 上 偏 移 地 赴 所 形成 的 值 可 能 指向 同 -个 内 存 地 址 。 
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不 同 的 段 地 址 和 偏 移 ;也 址 形成 的 指针 可 能 指向 同一 个 内 存 地 址 

Intel 8086 处 理 器 的 内 存 地 址 是 通过 组 合 16 位 的 段 地 址 和 16 位 的 偏 移 地 址 形成 的 。 在 加 
上 贪 移 地 址 之 前 . 段 好 址 这 左 移 4 位 ， 这 就 意味 着 许多 不 同 的 段 地 址 / 偏 移 地 址 组 合 可 能 指向 
同一 个 内 存 闻 址 。 





段 地 址 ( 左 移 4 位 后 ) 人 篇 移 地 址 最 终 地 址 
A0000 二 FFFF 到 AFFFF 
AFFF0O + COOF = AFFFF 


一 般 来 说 ， 大 约 有 0%.1000 (4096 ) 对 不 同 的 段 地 址 / 偏 移 地 址 组 合 可 以 指向 同一 个 内 存 
地 址 。 


C 庄 鼎 编译 辈 设计 少 必 须 确定 ， 在 PC 中 这 些 指针 是 以 规范 的 方式 进行 比较 的 。 否 则 的 
话 ， 可 能 会 出 现 两 个 位 模式 不 同 但 指向 同一 个 内 存 地 址 的 指针 被 错误 地 比较 为 不 相等 。 如 果 
使 用 了 “buge” 关 键 字 (使 用 huge 内 存 模式 )， 这 些 |. 作 会 白 动 完成 ， 介 如果 使 用 了 “large” 
模式 ， 则 不 会 如 此 。 在 Misrosoft C 中 ，far 关键 了 表示 指针 存储 了 上 段 寄 存 溉 的 内 容 和 偏 移 地 
址 。near 关键 学 肯 示 指针 只 存储 16 位 的 偶 移 地 址 ， 它 的 段 地 址 使 用 当前 数据 段 或 堆栈 段 宽 在 
器 中 的 值 ， 





0 EO EA EET OR 

pa 小 启 发 

A 
内 存 容量 单位 一 览 
单位 2 的 夹 方 数 含义 字 节 数 
Kilo pa 1000 个 字 节 1 024 
Mega 2 100 万 个 字 节 1 048 576 
Giga 2 10 亿 个 字 节 1 073 741 824 
Tera 2 1 万 亿 个 字 节 1 099 511 627 776 

Bubba pa 1800 亿 亿 个 字 节 18 446 744 073 709 551 616 


142 


第 7 章 ”对 内 在 的 思考 


在 讨论 数 子 概念 时 ， 圭 要 注意 所 有 的 磁盘 制造 商都 是 使 用 十 进 制 数 而 不 是 … 进 侧 数 米 才 省 
斑 旨 的 容 拭 。 所 以 2GB 的 磁盘 可 以 存储 2000000000 个 学 节 的 数据 而 不 古 2147483648 个 他- 闻 : 

64 位 的 地 址 是 非常 记 大 的 ， 它 可 以 掀 整 部 用 贞 清 晰 度 电视 播放 的 影片 都 存 斤 在 内 在 中: 
对 二 商 清 蜥 度 电 视 尚 匹 明确 的 定义 ;但 人 致 相当 于 SVGA 中 1024X768 像素 的 分 辨 率 ， 其 中 
他 个 像素 宕 要 3 个 宁 节 的 色彩 信息 。 

按 每 秒 钟 显示 30 帧 :日 前 NTSC 的 标准 ) 计 ， -部 攻 度 为 两 个 小 时 的 影片 将 占 抛 : 

120 分 钟 X60 从 x 0 烦 X786432 像素 X3 色彩 ' 子 广 

= 509607936000 字 





= 500GB 的 内 存 

你 可以 在 64 位 的 虚拟 内 存 地 址 空间 中 存放 不 止 部， 而 是 3600 万 部 高 清晰 度 电 规 影 | 
(这 个 数 旦 大 人 超出 了 目 果 已 生 产 的 所 有 影片 的 总 和 )。. 你 还 需要 为 操作 系统 久 出 空间 ， 不 过 
没 问 题 ， 当 前 SVIPDI 所 弄 定 的 UNIX 内 核 个 过 是 512MB- 当然， 你 还 党 要 解决 个 则 题 ， 帕 
是 找到 足够 大 的 物理 伐 盘 来 备份 这 个 巨 时 的 瞳 拟 内 存 。 

今天， 计算 机 系统 结 坎 的 真 止 挑战 不 在 于 内 存 的 容量 ， 而 起 内 存 的 速度 ,| 如 果 你 的 软件 
实际 上 受到 磁盘 和 内 存 的 等 待 时 间 【 访 问 时 间 ) 的 限制 ， 那 么 即使 是 光彩 夺 日 的 Pentium 起 
中 也 没有 用 武之 地 , 淮 确 地 说 ， 在 内 存 和 CPU 的 性 能 之 间 存 在 一 道 很 深 的 鸿沟 ， 而 昌 十 越 来 
战 深 。 在 过 去 的 10 年 里 ， 每 隔 一 年 半 至 其 年 ，CPU 的 速度 就 会 提升 一 倍 。 检 机 问 的 时 间 内 ， 
内 存 的 容量 倒是 扩大 了 一 售 “从 64KB 增加 到 128KB >， sm ! 提 高 了 10%。 人 在 
二 型 弛 址 容 间 的 机 可 中 ， 主 存 访问 时 间 的 重 归 性 将 进一步 廿 现 。 当 访问 海草 数据 时 ， 它 所 耗 
喊 的 内 存 访问 时 间 将 左右 软件 的 性 能 。 我 们 只 能 寄 望 林 米 能 看 到 Cache 以 及 相关 技术 的 更 广 
江 使 用 . 





WA NE I TR I SE ee tA NT ca mwarreevavvwowrevaverw ae 


小 启发 





A rT rE ET TEEN TA an 


MS -DOS 640K 的 限制 缘何 而 来 


在 MS-DOS 下 运行 钓 应 用 程序 都 有 面临 一 个 严峻 的 内 存 限 制 ， 那 就 是 可 用 内 存 只 有 
640KB。 这 个 限制 源 于 Intel 8086 这 个 最 初 的 DOS 机 器 的 最 大 地 址 范围 ，8086 支持 20 位 的 
地 址 ， 总 共 是 1MB 的 内 看 。 之 所 以 只 能 使 用 640K 是 因为 某 些 段 (每 个 64KB ) 必须 平 以 保 
留 ， 供 系统 所 用 : 


段 保留 用 于 
F0000 到 FEFF 64KB， 永 久 性 的 ROM 区 域 BIOS、 诊 断 信 息 等 
D0000 到 EFFF 128KB， 用 六 ROM 存储 区 域 


”SYID - System V [Interface Definitian (系统 V 接口 定义 ) -- 一 是 -- 份 撒 述 System VAPI 的 重 代 级 文档 ， 
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C0000 到 CFFF 64KB， 用 于 BIOS 扩展 (XT 硬盘 ) 
B0000 到 BFFF 64KB， 用 于 常规 性 的 肉 存 显示 
A0000 到 AFFF 64KB， 用 于 显示 内 存 扩 展 

其 余 


00000 到 9FFFF 


vn enrrrraee 


640KB， 用 于 应 用 程序 


billion 和 trillion 在 类 法 和 英 庄 小 的 含义 是 不 同 的 。 在 美 说 中 ， 它 们 分 别 是 10 亿 (105 和 | 
万 亿 (105。 在 英语 中 ， 它 们 代表 的 数目 要 大 得 多 ， 分 别 是 1 万 亿 (10 四 和 100 亿 亿 (100。 我 
们 网 倾向 美式 用 法 ， 因 为 数量 级 的 增长 从 下 (105) 到 再 万 (10)， 再 到 10 亿 (10) 和 1 万 亿 (10) 
比较 有 连贯 性 。 英 国 的 billionarie《 亿 力 窜 伍 ) 比 英国 的 billionarie 娄 常 在 得 多 一 一 除 玫 是 同 
货币 汇 举 变 成 1000 区 镑 总 换 1 美元 ， 

MS-DOS 的 640KB 内 好 限制 源 于 8086 芯片 总 共 ]MB 的 地 址 空间 。MS-DOS 把 整整 6 
个 段 贸 给 自己 使 用 ， 只 留 下 10 个 64KB 的 段 归 应 用 程序 使 用 ， 起 始 地 址 为 0 (其 中 第 0 电 的 
最 低地 址 也 保留 给 系统 使 用， 用 作 缓 冲 区 和 MS-DOS 的 工作 存储 )。 正 如 Bi Gates 在 1981 
年 所 说 的 那样 ,，“640KB 内 人 存 对 于 所 有 人 来 说 都 已 足够 了 ”。 当 PC 刚刚 出 现 的 时 候 ，640KB 
内 存 听 上 去 像 是 一 个 天 文 数 字 。 事 实 上 ， 最 早 的 PC 把 16KB RAM 作为 标准 配置 。 






时 人 





1 
= 
= 


CT 


PC 的 内 存 模型 


Microsoft CC 认可 下 面 几 种 内 存 模 型 ; 

simall 所 有 的 指针 都 为 16 位 ， 代 码 和 数据 都 限定 在 一 个 单一 的 段 中 ， 程 序 最 大 规模 
为 128KB ( 代码 段 和 教 据 段 各 64KB ) . 

large 所 有 的 指针 部 为 32 位 ， 程 序 可 以 包含 许多 个 64KB 的 段 . 

medium ”区 数 指针 为 32 位 ， 所 以 代码 段 可 能 有 多 人 个。 数据 指针 为 16 位 ， 所 以 只 大 一 
个 64KB 的 数据 段 。 

compact medium 的 另 一 种 形式 : 函数 指针 为 16 位 ， 所 以 代码 最 多 不 超过 64KB。 数 据 

间 针 为 32 位 ， 所 以 数据 可 以 占据 多 个 段 ， 但 堆栈 里 的 数据 仍 限 制 在 一 个 64KB 的 段 内 ， 

Microsoft C 认可 下 面 这 些 非 标准 的 关键 字 ， 当 它们 应 用 于 对 象 指针 或 函数 指针 时 ， 只 是 
覆盖 相应 类 型 的 指针 。 

_ near 16 位 指针 

_far 32 位 指针 ， 但 它 所 指向 的 对 象 必 须 全 部 位 于 同一 个 段 中 (所 有 的 对 象 均 不 得 
超过 64KB ) 。 也 就 是 说 ，- 一 旦 载 入 段 寄 存 器 后 ， 你 就 可 以 取得 段 内 所 有 对 和 象 的 地 址 ， 
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__huge ”32 位 指针 ， 上 述 所 有 对 稚 的 限制 都 不 存在 、 


例 : char 一 ug * banana; 





在 页 省 设置 之 外 , 你 ， 六 丰 他 生生 自行 显 式 地 声明 near. far 和 huge 指针 . huge 
针 始终 会 按照 它 的 规范 形式 的 值 进行 比较 和 指针 运算 . 在 规范 形式 下 ， 指 针 的 偏 移 地 址 的 
范围 是 0-15。 如 果 两 个 指针 都 是 规范 形式 的 ， 以 unsigned [ong 为 类 型 进行 的 比较 将 会 得 到 正 
确 的 结果 。 
如 果 把 数组 和 结构 的 大 小 ， 指 针 的 大 小 、 内 存 模型 以 及 80x86 的 硬件 操作 模型 在 程序 中 
以 多 种 形式 存在 且 相 互 影响 ， i 给 编译 带 来 很 大 的 困难 ， 并 容易 产生 错误 . 


Terry A a 


随 着 电子 表格 和 他 处 理 软 件 途 渐 出 显示 它们 的 强大 功能 ， 计 算 机 对 内 存 的 需求 也 越 来 越 
苘 。 人们 投入 了 所 大 的 精 2 来 处 理 IJBM PC 上 受 限制 的 地 址 空间 ， 提 出 了 各 种 备 样 的 内 存 扩 
展 方案 (expandenD 利 内 存 扩充 方案 (extendem， 但 还 波 有 找到 一 个 令 人 满意 的 品 移 梢 的 解决 方 
案 。MS-DOS 从 木质 上 说 在 一 种 移植 到 8086 上 的 CPM， 它 所 右 的 后 续 版 本 都 维持 了 与 最 初 
瞩 木 的 兼容 性 。 这 就 是 为 什么 DOS 6.0 仍然 是 一 个 单 任务 系统 并 依然 使 用 80x86 的 “实地 址 
(real-address， 与 8086 菩 宪 )” 模 型 ， 从 而 仍然 保持 对 用 户 程 序 地 址 空间 的 限制 。8086 内 存 模 
型 还 行 在 男 外 一 些 人 们 不 希望 出 现 的 效果 , 每 一 个 运行 二 MS-DOS 的 程序 都 拥有 不 受 限 制 的 
特权 , 这样 便 很 容易 受到 疾 毒 软件 的 攻击 .如 果 MS-DOS 了 使 用 了 从 80286 起 内 置 于 所 有 Intel 
处 理 器 的 内 存 和 任务 保护 恒 件 ，PC 病毒 或 许 根 本 不 会 出 现 。 


7.3 ”虚拟 内 存 


克 且 你 能 ni 
如 有 果 它 不 存在 ， 但 你 能 看 见 它 一 一 pa 


如 果 它 存在 ， 但 你 看 不 见 它 一 一 它 是 透明 的 (transparenb) 
如 果 它 不 存在 ， 而 且 体 也 看 不 见 它 一 一 那 肯 定 是 你 把 它 擦 挤 了 . 
一 一 JBM 订 于 冲 拜 遍及 1 凡 疗 措 疙 般 同 ， 大 约旦 辣 1978 年 





和 MS-DOS 一 样 ， 让 程序 受 安装 在 机 器 上 的 物理 内 存 数量 的 限制 是 非常 不 便 的 。 很 时 的 
时 候 ， 在 计算 机 领域 中 人 们 就 提出 了 虚拟 内 存 的 概念 ， 晶 的 就 是 为 了 去 除 这 个 限制 。 它 的 基 
本 思路 是 用 廉价 但 缓慢 的 磁盘 来 扩充 快速 却 昂贵 的 内 存 。 在 任 一 给 定时 刻 ， 程 序 实际 需要 使 
用 的 虚拟 内 存 区 上 段 的 内 容 就 被 和 载 入 物理 内 存 中 。 当 物理 内 存 中 的 数据 有 一 - 段 时 间 林 被 使 用 ， 
它们 就 可 能 被 转移 到 便 盘 中 ， 节 省 下 来 的 物理 内 存 补 问 用 于 载 入 湖 要 使 用 的 其 他 数据 。 所 有 


， 我 们 深 知 其 中 微妙 ， 所 以 我 们 号 以 绝对 秽 范 的 方式 来 使 用 “规范 ”这 个 词 的 。 
145 


C 去 家 编程 
现代 的 计算 机 系统 ， 从 最 大 的 超级 计算 机 到 城 小 的 丁 作 站 ， 除 了 PC' 之 外 ， 痢 使 用 了 了 虐 拟 内 
让 、 

Re 
成 的 ， 域 觉 王 称 粒 粒 镜 从 成 米 般 。 程 序 员 必 须 花费 极 人 的 精力 扎 踪 任 一 寺 刻 哪些 数据 是 
0 并 根 捉 调 要 人 在 段 之 阅 米 四 切 换 。 老 式 的 说 二 如 COBOL 伟 然 包含 了 大 明 鸭 特 
性 ， 几 十 操作 这 种 内 存 窗 藉 。 这 种 方法 实在 是 太 过 时 了 ， 它 对 村 当代 的 程序 员 而 主根 本 不 瑟 
各 可 操作 人 性: 

多 层 存 储 是 一 个 类 似 的 概念 , 我 们 可 以 在 一 台 计 算 机 中 介 处 看 介 它 的 在 在 上 划 容 在 器 ws。 
主 存 )。 从 理论 上 上 说， 内存 的 笠 个 位 置 邦 可 以 用 寄存 器 来 代替 ， 但 在 实际 上 上， 这样 做 的 成 本 将 
起 不 切实 际 地 昂 贰 ， 所 以 必须 牺牲 一 些 访 门 速 度 来 人 幅 降 低 存储 系统 的 实现 成 本 、， 虚 地 内 存 
以 是 对 多 大 仔 储 进 行 扩 人 充 ， 使 用 磁盘 而 不 吓 主 存 来 保存 运行 进程 的 映像 ， 所 以 说 它们 实生: 上 
是 同一 种 策略 ， 





NAA dt we oo 


内 存 召 介 的 速度 与 成 本 关 


人 快速 访问 

TO AAA < > 

I 人 克 4 Et. 
磁带 辜 盘 内 存 


Cache 存储 器 CPU 寄存 器 


成 本 低 、 容 量 大 一 > 成 本 高 、 容 量 小 


练习 : 根据 你 所 熟 态 的 系统 ， 填 入 典型 的 访问 时 间 、 成 本 ， 容 量 的 实际 数字 ， 














每 位 成 本 ($)， ue 

访问 时 间 : I 

最 大 容量 : = 下 
”只 限 于 DOS 时代， 现在 的 window* 系统 也 使 用 了 旦 拟 内 存 。 -一 一 译 者 注 
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SunOS 由 的 进程 执行 天 32 位 地 址 空间 。 操 作 系 统 负 责 其 体 册 节 ， 使 每 个 进程 部 以 为 自 
己 拥 丰 整个 地 址 空间 的 狂 家 访问 权 。 这 个 纪 洲 是 授 过 “虚拟 内 存 ” 实 现 的 .所 有 进程 其 至 机 
虎 鸭 物理 内 存 ， 当 内 在 丰 完 时 就 用 磁盘 保存 数据 。 在 进程 运行 时 ， 数 据 在 磁盘 和 内 存 之 问 米 
加 移动 。 内 存 管 直 三 件 负责 把 虚拟 地 此 翻译 火 物 型 地 丰 ， 并 让 -个 进程 始终 运行 十 条 统 的 真 
在 内 存 中 。 应 用 程序 程序 员 具 看 到 万 拟 地 址 ， 并 不 知道 白 己 的 进程 在 嫌 盘 和 内 存 之 间 米 回 切 
换 ， 除 非 他 们 观察 运行 时 间或 首 察 看 诸如 “ps ”之 类 的 系统 命令 ， 峡 7-3 星 全 了 有关 虚 拟 内 


人 存 的 “上 些 其 础 知识: 
CCPL 测 香 域 各 
jG 


” 物 厘 地 吉 


泪 程 虚拟 所 罗 
地 址 给 轩 - 


” 虚拟 地 址 : 
| 内 他 管理 单元 
:YIMTLJ) 


i 物 呈 内 在 
系统 小 的 镁 7 :LM 
个 进程 部 有 
馈 己 的 地 址 
宇 阿 





出 7-3 虚拟 内 存 基础 知识 


虚拟 内 存 道 过 “页 ”的 形式 组 织 .| 页 就 是 操作 系 红 在 磁盘 和 内 存 之 间 移 来 移 去 眠 进行 保 
护 隐 音 位， 一般 为 几 天 字 太 可 以 道 过 键入 /usrucbypagesize 来 观察 你 葛 系 统 中 的 页 而 大 小 。 
着 帮 乓 上 在 加 证 而 业 二 册 可 四 来 辐 攻 轨 和 称 它们 是 page in (移入 内 存 ) 或 page out( 移 
到 伐 盘 )。 

从 潜在 的 可 能 性 上 说， 与 进程 有 有关 的 所 有 内 存 部 将 被 系统 所 使 用 ， 划 果 该 进程 汀 能 不 会 
己 上 运行 (可 能 它 的 优先 粥 低 ， 也 可 能 是 它 处 于 睡 晓 状态 )， 操 作 系 统 可 以 暂时 取 回 所 有 分 本 
给 它 的 物理 内 存 资源 ， 将 该 进程 的 所 有 相关 信息 都 备份 到 磁盘 上 。 这 样 ， 这 个 进程 就 被 “ 换 
小 ”在 塘 代 中 有 一 个 特殊 的 “交换 区 ”用 十 保存 从 内 存 中 换 出 的 进程 。 在 -人 台 机 器 中 ， 交 
换 区 和 的 人 小 一 般 是 物理 内 存 的 几 倍 。 具 有 用 户 进 程 才 会 被 换 进 换 出 ，SunOS 内 核 常 驻 于 内 存 
中 ， 





进 种 具 能 操作 位 上 物理 内 存 中 的 页 而 。 当 进程 引 用 一 个 不 在 物理 内 存 中 的 页 而 时 ，MMU 

中 会 产生 “个 页 错误 。 欠 核对 此 事件 做 出 响应 ， 并 判断 该 引用 是 徊 有 效 ， 如 果 匹 效 ， 内 核 向 

进行 发 出 一 个 “segmentation violation 段 违规 )” 的 信号 ， 如果 有 效 ， 内 核 从 人 磁 人 得 取 站 该 页 ， 
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换 入 鲁 内 存 中 。 一 - 旦 负面 进入 内 存 ， 进 程 便 被 解 谢 ， 可 以 重新 运行 一 一 进程 本 中 并 不 知道 它 
曾经 内 为 页 面 换 入 事件 壬 竺 了 会。 

SunOS 对 十 磁 玲 的 文件 系统 和 主 存 有 -种 统一 的 观点 。 操 作 系 统 使 用 相 问 的 底层 数据 结 
构 《vnoge,， 或 称 “ 虚 拟 结 点 ”) 来 操纵 这 两 者 .所 有 的 虚 毛 内存 操 作 孝 出 二 同样 的 设计 此 学 ， 
胞 是 把 文件 区 域 映 射 到 内 存 区 域 中 。 这 可 以 提高 性 能 ， 并 允许 可 观 的 代码 复 用 。 你 可 能 听 说 
过 “hat layer《〈 椅 子 居 )” 一 一 歌 是 虹 动 MMU 的 “而 件 地 址 翻译 ”软件 。 它 极度 依赖 硬件 ， 
每 出 现 .个 新 的 计算 机 架构 ， 它 部 必须 重新 改写 ， 

虚拟 内 存 氏 已 成 为 “项 : 沫 作 系 统 中 不 可 或 缺 的 技术 ， 它 允许 多 个 进程 运行 于 较 小 的 物理 
内 在 中 。 本 章 的 轻松 一 下 栏目 对 虚拟 内 存 台 一 个 额外 的 描述 ， 是 以 离 言 的 形式 出 现 ， 非 常 经 


Whe ee hr WS NDR DY WWE tr SP eld Bb A Ap vr 





你 可 以 分 配 多 大 的 内 存 
运行 下 列 程序 ， 看 看 在 你 的 进程 中 可 以 分 配 多 大 的 内 存 . 


#include <stdio.h> 
#include <stdlib,h> 
maint) 

{ 


int MB = 0; 
whilet{tmalloctl << 20)) +-MB; 
printft"Alocated %d MB total‘\n', MS}: 
) 
总 共 分 配 的 内 存量 取决 于 交换 区 和 你 的 系统 配置 中 的 进程 限制 ， 如 果实 际 分 配 的 内 春 块 
小 于 1M 字 节 ， 你 实际 得 到 的 内 存 是 否 比 这 要 多 一 些 ? 为 什么 ? 
为 了 芯 这 个 程序 能 够 在 有 内 存 限 制 的 MS-DDS 上 运行 ， 把 每 次 分 配 的 单元 从 1MB 政 为 
1KB ( 就 是 把 1<<20 政 为 1:<<10， 并 用 KB 代替 MB ) ， 





rr 


7.4 ”Cache 存储 器 


Cache 存储 器 是 多 居 存 情 概念 的 更 深 扩 展 。 它 的 特点 古 容 量 小 、 价 格 尚 、 速 度 惧 。Cache 
位 于 CPU 和 内存 之 间 ， 龙 一 种 极 快 的 存储 缓冲 区 。 从 内 存 管理 单元 (MMU) 的 角度 看 ， 有 些 
机 如 的 Cache 是 属于 CPU -- 侧 的 ， 比 如 Sun 的 SPARCstation 2 中 即 是 如 此 。 在 这 种 情况 下 ， 
Cache 使 用 的 足 虚 氢 地 址 ， 站 每 次 进程 切换 时 ， 它 的 内 容 必 须 进 行 币 新 ( 见 图 7-4)。 也 有 有 一 
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些 机 器 的 Cache 从 MMU 的 角度 看 是 属于 物理 为 存 一 侧 的 ， 比 如 SPARCstation 10 好 是 如 此 ， 
在 这 种 情况 下 ，Cache 使 月 的 是 物理 地 址 ， 这 就 容易 使 多 处 理 器 CPU 睦 蛙 同一 个 Cache: 

席 有 的 卉 代 处 理 器 几 囊 用 了 Cache 存储 器 。 当 数据 从 内 存 读 入 时 ， 整 “ 行 ”( - 般 16 战 
32 个 学 节 ) 的 数据 被 装 入 Cache。 如 果 程 序 共 有 和 良好 的 地 址 引用 局 部 性 如; 它 顺 友 浏览 一 
个 学 符 忠 )， 那 么 CPU 以 后 对 邻近 数据 的 引用 就 可 以 从 快速 的 Cache 法 下 ， 和 而 不 用 从 绥 悍 的 
内 存 帆 恋 取 。Cache 操作 六 速 嵌 与 系统 的 周期 时 间 机 同 , 所 以 -个 SOMHz 的 处 理 器 , 共 Cache 
的 存 取 周 期 为 20ns。 企 典型 情况 上 上 ， 主 存 的 存 取 速度 二 能 只 有 它 的 巴 分 之 一 ! 与 前 规 的 内 存 
相 比 ，Cache 此 真得 多 ，: 革 位 体积 也 更 大 ， 消 耗 的 能 量 也 更 多 。 所 以 ， 在 系统 中 我 们 把 它 作 
为 存储 系统 的 附加 部 分 ， 而 不 是 把 它 作为 惟 的 存储 形式 。 

Cache 包含 一 个 地 址 的 列表 以 及 它们 的 内 容 。 随 着 处 理 器 不 靳 3[ 败 新 的 内 存 地 址 ，Cache 
的 地 址 列表 也 一 育 处 于 变 沙 中 。 所 有 对 内 存 的 读 取 和 写 入 操作 部 更 经 过 Cache。 当 好 再 器 需 
要 从 一 个 特定 的 地 由 提 寂 数据 时 ， 这 个 请 求 首先 递交 给 Cache。 如 抹 数 据 已 经 存在 Cache 
中 ， 它 就 可 以 立即 被 提 球 ,否则 ，Cache 向 内 存 传递 这 个 请 求 ， 于 是 就 要 进行 较 缓慢 的 访问 
内 存 操作 。 内 存 读 取 的 数 湄 以 行为 单位 ， 在 读 取 的 癌 时 也 对 入 到 Cache 中 。 


CPU | 


虚拟 地 址  》 2、 
dd 


内 存 管理 单元 物 弄 
(MMU) 物理 地 址 内 在 


图 7-4 Cache 存储 器 的 基本 知识 


如 果 你 的 程序 的 行为 硕 为 怪异 ， 以 致 每 次 都 无 法 命中 Cache， 烤 么 ， 程 序 的 性 能 比 不 采 
用 Cache 还 要 差 。 因 为 每 次 判断 Cache 是 个 命中 的 额外 逻辑 并 不 古 免 费 的 午 移 。 

Sun 当前 使 用 两 种 类 型 的 Cache: 

*。 全 与 法 (write-throutgh)jCache 一 一 每 次 写 入 Cache 时 总 是 同时 写 入 到 内 存 中 ， 使 内 存 和 
Cache 始终 保持 一 致 。 

。 写 回 法 (write-back;Cache 一 一 当 第 -次 写 入 时， 只 对 Cache 进行 号 和 入， 世代 忆 经 写 入 
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过 移 Cache 行 于 次 需要 写 人 时 ， 此 时 第 - - 议 写 入 的 结果 尚未 保存 ， 所 以 要 先 把 它 中 入 说 内 和 存 
路 ， 当 内 核 切 换 进 程 时 ，Cache 中 的 所 有 数据 也 都 要 先 写 入 到 内 存 中 。 

在 则 种 情况 卜 ，“ 且 对 Cache 的 访问 结束 ， 指 令 流 邦 将 继续 横 行 ， 不 用 等 待 组 人 恤 的 内 存 
操作 全 部 完成 ， 

SPARCstation 2 拥有 64KB 的 全 写法 Cache， 等 一 行 基 32B。 比 这 个 大 得 多 的 Cache 也 越 
来 越 带 见 ，SPARCscrver .000 拥有 1M 了 节 的 写 同 法 Cache。 如果 处 理 器 使 峙 内存 喘 时 
(memory-mappe 遇 的 TD， 可 能 会 出 项 供 IO 总线 使 用 的 Cache， 而且 现在 经 常 出现 分 离 的 指 
令 Cache 和 数据 Cache。 事实 上 还 可 能 出 现 客 层 的 Cache, 而 月 Cache 可 以 出 现在 任何 存 奋 快 
还 / 慢 速 设备 的 接站 《如 磁盘 和 内 存 )。PC 丝带 使 用 由 让 在 构 成 的 Cache 来 提高 速 忆 较 慢 有 的 
倍 伪 的 存 取 速度 ， 称 为 “RAMdisk”"。 存 UNIX 中 ， 闪 在 就 是 磁盘 inodc 的 Cache。 时 此 切 新 
栅 兹 电源 前 如 果 不 司 用 “syvnc” 命 令 把 Cache 内存) 的 内 容 刷 新 介 磁 由 中 ， 文 什 系统 眶 
可 能 损坏 。 

对 了 村 编写 应 用 程序 的 程序 员 而 总 ，Cache 和 虚拟 内 存 部 是 透明 的 ， 但 知道 它们 所 能 批 供 
隐 好 处 以 及 它们 可 以 戏剧 妊 地 影响 系统 性 能 的 行为 是 非常 重要 的 ， 





表 7-1 Cache 的 组 成 
术 语 定 多 
和 (line) 行 前 i Cache 进行 访问 的 单位 。 每 行 山 岗 部 分 组 成 : :个 数据 部 分 以 及 :个 标 


签 ， 用 十 指 证 它 所 代表 的 地 此 


块 (block) 个 Cache 行内 的 数据 被 称 作 块 。 块 保存 米 问 移动 于 Cache 行 和 内 在 之 同 约 守重 
数据 : 一 个 由 型 的 块 为 32 字 季 。 
-个 Cache 行 的 内 容 代 表 特 定 的 内 存 抉 ， 如 果 处 理 器 试图 访问 慑 二 该 块 地 败 范 旧 
的 内 在 ， 忆 就 会 作出 反应 ， 速 度 月 然 莫 比 访问 内 丰 快 得 多 ， 
企 计算 机 行业 中 ， 对 绝 大 多 数 人 而 过 ，“ 据 ”和 “ 行 ”的 概念 分 得 并 不 特别 消 ， 
涡 省 常 请 可 以 交换 使 用 


Cache 一 个 Cache (~- 般 为 64K 到 1M 之 问 ， 也 可能 息 匈 ) 几许 冤 行 给 成 。 有 时 也 使 出 
相关 的 使 件 来 加 速 对 标签 的 访问 。 为 了 提高 速度 ，Cache 的 位 置 离 CPU 很 近 ， 抽 
”县 内 人 系统 和 总 线 经 过 商 度 优 化 ， 尽 可 能 地 提高 大 小 等 十 Cache 块 的 数据 块 的 移 

动 速 度 
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厂 





Ns 


体验 Cache 
运行 下 面 的 程序 ， 看 看 在 你 的 系统 上 是 否 能 够 检测 到 cache 的 效果 


Hderine DOMHMROOETY Fori 
does-imationl|li|] = SocuacelIl 


1 = 0; 1 < 8353536; 1++) 1 


tclef ne SMARTCOOPFY momcpy (destiration, Soirde, E53 


main:'! 
{ 
cat source|ld535., degsilnci lion[ss535..; 
TEt 3 
{Ot a Go OD Trt) 
SMARTCOPY: 


tt Ci -0O cache.c 
tima 3.0ut 
lo soconds user Lime 
# 改 为 DUMBCOPY， 并 重新 编译 
$$ Zirea &.0ut 

?23.0 seconds user zinc 

编译 并 记录 上 面 程序 级 运行 时 间 ， 采 用 两 种 方式 ,第 一 种 就 是 上 面 的 程序 ， 每 二 种 就 是 
用 DUMBCOPY 宏 替 换 上 面 程序 中 的 SMARTCOPY 宏 ， 我 是 在 SPARCstation 2 上 运行 这 个 
程序 的 ， 使 用 条 拷贝 (dump copy) 的 程序 的 性 能 有 显著 的 下 降 . 

之 所 以 出 现 性 能 下 人 奸 是 因为 source 和 destination 的 大 小 正好 都 是 Cache 容量 的 整 救 信 ， 
SS2 上 的 Cache 行 并 不 是 该 顺序 填充 的 一 它 使 用 了 一 种 特别 的 工法， 填充 于 同一 Cache 行 
的 主 存 地 址 恰好 都 是 该 Cache 行 大 小 的 整数 倍 。 这 是 由 于 对 标签 存储 的 优化 所 引起 的 -一 在 
这 种 设计 方法 中 ， 只 有 地 :此 的 高 位 才 被 放 入 标签 中 .这样 一 来 ，souree 和 destination 便 不 可 
能 同时 出 现在 Cache 中 ， 于 是 导致 了 性 能 的 显著 下 降 . 

所 有 使 用 Cache 的 机 器 ( 包括 超级 计算 机 、 现 代 的 PC 以 及 定位 在 它们 之 间 的 各 种 机 器 ) 
在 性 能 上 都 会 受到 类 似 这 溃 变 和 态 情 况 的 严重 影响 .程序 的 运行 时 间 将 因 不 同 的 机 器 和 不 同 的 
Cache 实现 方 业 而 并 

在 这 个 source 和 destination 都 使 用 同一 Cache 行 的 特殊 情况 下 ， 会 导致 每 次 对 内 存 的 引 
用 都 无 法 命中 Cache， 使 CPL 的 利用 率 大 大 降低 ， 因 为 它 不 得 不 等 待 常规 的 内 存 操作 完成 
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崖 函数 memcpy() 经 过 特别 优化 以 提高 性 能 , 它 把 和 光 读 取 一 个 Cache 行 再 对 它 进 行 号 入 这 个 御 
坏 分 解 开 米 ， 这 就 避免 了 _- 述 问题 。 使 用 聪明 拷贝 (6mart copy) 可 以 大 幅度 地 提高 性 能 : 这 也 
显示 笠 仅仅 根据 思 8 维 单一 的 基准 (benchmak) 程 序 就 得 出 机 器 1 性 能 沁 的 各 告 论 是 多 么 的 是 夸 ，_ 


Vreven 


de 


7.5 ”数据 段 和 堆 


我 们 已 经 讨论 了 距 系 终 相 关 的 内 在 话题 的 背景 信息 ， 贡 和 在 是 重 新 访问 人 等 个 进程 内 部 的 内 

在 布 居 的 时 候 了 了。 由 然 你 经 知道 了 跟 有 系统 有 关 的 话题 ， 和 有 讨论 与 进程 有 有 半 的 话题 会 出 容易 
- 些 ， 旋 其 是 我 们 将 从 仔 强 规 察 进程 内 部 的 数据 段 帮 始 。 

就 像 堆栈 段 能 够 根据 出 要 白 动 增长 一 样 , 数据 段 也 包含 站 一 个 对 名 ,用 十 守 成 这 项 工作 ， 
这 屿 是 堆 (heap)， 岁 7-5 量 下 了 这 一 右 。 拆 区 域 用 于 动态 分 配 的 存 侍 ， 也 束 是 通过 mallec (内 
仓 分配 ) 函数 状 得 的 内 存 ， 并 通过 指针 访问 。 堆 中 的 所 在 东 贡 都 是 | 监 名 朱 不 能 按 名 学 二 
接 访 问 ， 只 能 通过 指针 间 援 访问 ， 从 雁 中 获取 内 存 的 改 一 办 法 就 是 通过 调用 malloc 以 及 同 
类 的 calloc 、realloc 等 ) 库 悄 数 。calloc 前 数 与 malloc 类 似 ， 但 它 在 返回 指针 之 前 完 把 分 配 寻 





最 高 内 存 地 址 


堆栈 段 -时 数 的 局 部 时 其 ， 


向” 呈 一 一 


re 才 一 一 brcak 
HT malloct) 





有 最低 内 存 地 址 
图 7-5 堆 的 位 四 
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的 内 人 存 的 内 容 者 清空 为 零 : 不 要 以 为 calloc 消 数 中 的 c 跟 C 语音 编程 有 关 一 一 它 交 意 忠 是 “分 
配 清 等 后 的 内 存 ” reallos 函数 改 挛 一 个 指针 所 指向 的 内 存 鼎 的 天 小 ， 帆 咱 以 将 其 扩 太 ,也 村 
以 把 它 缩小 ， 它 经 常 把 内 位 拷贝 到 别 的 地 方 然后 将 指向 新 地址 的 指针 返回 给 你 。 这 在 动态 增 
氏 圾 的 大 小 时 很 有 用 一 一 第 10 草 将 对 此 作 更 多 的 讨论 : 

堆 内 存 的 加 | 收 不 必 与 蕊 所 分 配 有 的 顺序 一 致 〈 人 其 至 可 以 不 后 收 )》， 所 以 无 序 的 malloc/free 最 
终 会 产生 唯 碎片。 堆 对 它 的 位 块 x. 域 都 宕 要 帘 切 留心 , 电 些 是 己 经 分 配 了 的 , 哪些 是 尚 林 分 本 的 ， 
其 中 一 种 策略 加 是 建立 一 个 可 用 块 * 白 出 存储 区 ”") 的 链表 ， 每 捧 由 mallec 分 配 的 内 存 块 部 在 : 
日 己 的 前 而 标明 白 己 的 大 小 。 有 些 人 用 arena 这 个 术语 描述 由 内 存 分 配器 (memory allocator) 管 理 
的 内 存 呐 的 集合 《在 SunOS 中 ， 就 是 从 当前 break 的 位 午 到 数据 段 结尾 之 问 的 区 域 )。 

被 分 本 的 内 存 总 是 经 过 对 齐 ， 以 适合 机 器 上 最 大 尺寸 的 诛 子 访问 ， -个 malloc 请 求 申请 
的 内 存 天 小 为 方便 起 见 一 般 被 圆 整 为 2 的 乘 方 。 回 收 的 内 存 可 供 乍 新 合用， 但 并 没有 广 使 
的 ) 办 法 把 它 从 你 的 进程 柳 出 交还 给 操作 系统 。 

堆 的 木器 由 一 个 称 为 break 的 指针 米 标识 ， 当 堆 管 惠 器 需要 更 多 内 存 时 ， 它 可 以 道 过 系 
统 调用 brk 和 sbrk 米 移 动 break 指针 。-- 般 情况 下 ， 不 必 由 自 己 显 式 地 调用 brk， 如 果 分 配 的 
内 存 容量 很 人 ，brk 最 终 会 被 日 动 调用 。 用 于 管理 内 在 的 调用 是 ; 








malloc 和 free 一 一 从 堆 中 获得 内 存 以 收 把 内 存 返 回 给 堆 。 
brk 和 sbtk 一 一 调整 数据 段 的 大 小 至 个 绝对 值 ‘ 遂 过 某 个 增 最 )。 





警告 :你 的 程序 可 能 无 法 同时 调用 malioc0 和 brk0。 如果 你 使 用 malloce，malloc 希望 当 
你 调用 brk 和 sbrk 时 ， 它 县 存 惟一 的 控制 权 。 由 于 sbrk 向 进程 提供 了 惟一 的 方法 将 数据 段 内 
存 返 上 9 给 系统 内 核 ， 所 以 如 果 使 用 了 malloc， 就 有 效 地 防止 了 程序 的 数据 段 缩小 的 可 能 性 。 
要 想 获 得 以 后 能 够 返回 给 系统 内 核 的 内 存 ， 可 以 使 用 mmap 系统 调用 来 映射 /devizero 文件 。 
需要 返回 这 种 内 存 时 ， 可 以 使 用 munmap 系统 调用 。 


7.6 ”内存 注 沁 


有 些 程序 并 不 需要 答 理 它们 的 动态 内 存 的 使 用 。 当 需 归 内 存 时 ， 它 们 简单 地 道 过 分 配 米 
詹 得 ， 从 米 椒 用 担心 如 何 炎 放 它 。 这 类 程序 包括 编译 器 利 其 他 -… 些 运行 一 段 回 定 的 (或 有 限 
的 》 时 间 然 后 终 庄 的 程序 。 当 这 种 类 型 的 程序 终止 时 ， 所 有 内 存 会 被 正 动 回收 。 细 心 查验 答 
热 内 存 是 否 再 要 回收 纯 届 浪费 时 间 ， 因 为 它们 不 会 再 被 使 用 。 

其 他 程序 的 生存 时 间 蛋 长 :点 。 有 些 革 有 具 如 日 历 管理 器 、 邮 件 工 上 共 以 及 操作 系统 本 身 经 
常 需要 数 日 妨 至 数 周 连续 运行 ， 并 需要 管理 动态 内 存 的 分 配 和 四 | 收 。 由 于 C 语言 通常 并 不 使 
用 坪 坡 收集 上 益 (自动 确认 首 问 收 不 再 使 用 的 内 存 块 ;， 这 些 C 程序 在 使 用 malloe0 和 free0) 时 
不 得 不 非常 慎重 。 堆 经 常 仿 出 现 两 种 类 型 的 问题 ; 

， 妓 放 虐 改 与 仍 谋 使 用 的 内 存 ( 秘 为 “内 存 损 坏 ”)。 


”如果 你 对 内 存 的 引用 超过 了 beeak 的 位 部 ， 你 的 程序 就 会 出 错 。 
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。 术 释 放 椒 入 使 用 的 内 存 《 称 为 “内 存 汇 沁 ). 

这 是 最 礁 被 调试 发 现 的 问题 之 一 。 其 果 登 汝 已 分 也 购 内存 据 本 手 使 用 商 程 序 员 并 不 释 必 
它们 ， 进 程 铝 会 - : 边 分 配 开 来 越 多 的 内 在 ， 一 边 却 并 不 释放 不 贞 使 用 的 亚 部 分 内 存 ， 





每 次 当 调 用 malloc 分 品 内 疗 时 ， 注 意 在 以 后 要 调用 相应 的 ffee 来 释放 它 ， 

如 采 不 知道 如 何 调用 free 与 先前 的 malloc 丰 对 应 ， 那 么 很 可 能 已 经 造成 了 内 存 泄 漏 | 

一 种 简单 的 方法 就 是 入 可 能 的 时 候 使 用 aloca0 来 分 配 动态 内 存 ， 以 避免 土 述 情况 ,， 当 离 
开 调 用 alloca 的 邓 数 时 ， 它 所 分 配 的 内 府 会 被 自动 释放 ， 

显然 ， 这 并 不 进 用 于 孝 些 比 创 建 它 们 的 函数 生命 期 更 长 的 结构 ， 和 但 如 果 对 象 的 生命 期 在 
该 函数 结束 前 便 已 终止 ， 这 种 建立 在 堆栈 上 的 动态 内 存 分 配 是 一 种 开销 很 小 的 选择 。 有些 人 
不 提倡 使 用 alloca, 因为 它 未 并 是 一 种 可 移植 的 方法 ,如 果 处 理 器 在 硬件 上 不 支持 堆栈 , alloca() 
就 很 难 高 效 地 实现 ， 


我 们 生 用 “内 存 洪 漏 ” 这 个 词 是 办 为 -种 入 有 的 资源 止 被 “个 进程 榨 十 。 内 存 泄 满 的 上 
要 可 和 克 症 状 就 是 非 魁 进程 的 速度 会 减 慢 。 康 因 是 体积 大 的 进程 更 有 可 能 被 系统 换 出 ， 让 别 的 
进 穆 运 行 ， 而 且 大 的 进程 在 换 进 换 出 时 花费 的 时 间 也 更 多 。 革 使 《从 定义 上 上 说) 洪 漏 的 内 存 
本 里 话 不 被 3 用 , 但 它 仍 司 能 存在 于 页 面 中 (内容 自 然 想 片 坡 )， 这 样 就 增加 了 进程 的 工作 页 
数 重 ， 降 低 了 忻 能 ， 妨 外 需要 注意 的 点 是 ， 漆 潮 的 内 存 往 往 比 生 记 释放 的 数据 结构 此 人 ， 
内 为 malioc(O) 所 分 配 的 内 存 通常 会 较 整 为 下 一 个 大 于 让 请 数量 的 2 的 称 数 次 方 (如 中 请 212R、 
会 圆 整 为 236B )。 人 在 资源 丰 限 的 情况 下 ， 即 使 引起 内 存 济 江 的 进程 首相 运行 ， 整 个 系统 的 运 
行 速度 也 会 被 拖 慢 。 从 理论 上 说 ， 进 程 的 大 小 有 -个 上 上限 值 ， 这 在 不 同 的 操作 系统 中 各 下 机 
同 。 在 当前 的 SunOS 版 本 中 ， 进 程 的 最 大 地 址 室 间 可 以 多 达 4GB。 上 事实 上 ， 在 进程 所 洪涛 的 
内 在 远 末 达 审 这 个 数量 时 , . 洲 盘 的 交换 区 早已 消耗 玛 尽 , 如果 你 阅读 本 书 的 时 间距 现在 (1994) 
超过 5 年， 也 就 是 伯 20 世纪 末 的 时 候 ， 候 可能 会 对 这 个 早 己 过 时 的 限制 丸 俊 不 51!， 


如 何 检测 内 存 泄漏 


观察 内 存 泄 泗 是 “个 两 步骤 的 过 程 。 首 先 ， 使 用 swap 命令 观 嵌 还 有 多 少 可 用 的 交换 空 
问 ; 





事实 上 时 在 52002》 的 主流 机 可 信条 32 位 ， 所 以 单个 进 和 多 宝 负 限 萎 仍 为 4GB， 不 过 磁盘 容 虽 [大 为 增加 ， 抱 杂 出 现 进 各 这 
到 4GB 人 痢 侈 换 区 的 本 丁 尽 ( 畔 沦 上 这 种 情况 也 是 有 可 屁 的 。 一 - - 译 者 汪 
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AUSrrebinmyswap -8 
total: 17228k bytes allocated + $396K reserved = 22624K used, 29548K available 
(共计 : 177228K 已 分 配 +5396K 用 于 保留 =22624K 已 用 .29548K 可 用 ) 
和 所- 册 分 钟 内 键入 湾 命 令 二 到 四 次 ， 君 看 可 用 的 区 换 攻 荐 省 在 减少 。 还 可 以 使 用 让 他 
Ejusrfbinf*stal .1 上 共 如 nectstat、vmstat 等 。 如 果 发 现 不 断 有 有 内 存 被 分 山 且 从 不 税 放 ，… 个 休 能 
的 解释 眶 是 有 个 进程 出 现 广内 存 汇 漏 。 





在 所 有 的 网 络 检测 工具 中 ， 最 神奇 的 莫 过 于 snoop 了 . 

snoop 是 SVr4 中 etherfind 的 替代 品 ， 它 从 网 络 中 捕 提 分 组 fpackeD0， 并 在 你 的 工作 站 上 
显示 ， 你 可 以 告诉 Snoop 只 把 精力 集中 于 一 至 两 台 机 问 ， 也 就 是 你 自己 的 工作 站 和 服务 其 . 
这 对 于 检测 连接 故障 非常 有 用 一 snoop 甚至 可 以 告诉 你 字 节 数据 正 从 你 的 机 器 中 发 出 

但 snoop 最 好 的 特性 就 是 它 的 -a 选项 它 可 以 使 snoop 让 每 个 分 组 都 在 工作 站 的 扬声器 
中 输出 一 个 滴答 声 ， 你 可 以 难听 网 络 的 以 太 交 通 。 不 同 的 分 组 长 度 具 有 不 同 的 调幅 ， 如 果 你 
便于 全 用 snoop -ss 你 会 对 那些 伍 记 音 了 如 指 学 ， 可 以 人 稍 “ 开 打 ” 来 栓 测 并 优化 四 络 ， 


第 二 个 步骤 就 龙 确 定 可 颖 的 进程 ， 看 看 它 芷 不 是 该 为 内 存 油 漏 负责 。 你 可 能 已 经 知道 哪 
个 进程 是 罪 灶 祸首， 不 然 可 以 使 用 “pa -lu 用 户 名 ”命令 来 显示 所 有 进程 的 人 小 ， 如 下 所 朱 


EE 8 WID PI PRPLY PRI KI ZADLR SZ 内 中 习 六 N TT TIME COMD 
8 8 5393 228 224 80 1 20 ff[38f000 139 ff38fild3 pts/3 0:01 wt 
8 2 5303 921 226 23 1 20 ff38c000 143 Ets/3 0:00 ps 


标题 为 SZ 的 列 斌 是 以 入 而 数 表 示 的 进程 的 人 小 《如 果 一 定 想 知道 以 KB 表示 的 页 面 的 
人 人 小， 可 以 使 用 pagesize 合 令 )。 同样 数 次 重复 这 个 命令 ， 可 以 发 现任 合 动态 分 本 内存 的 进程 


的 人 小 都 在 增长 。 如 果 一 个 进程 者 去 不 断 地 增长 而 从 不 缩小 , 它 就 可 能 出 现 了 内 存 泄 油 。 
一 个 非常 翡 哀 的 项 实 是 ， 管 理 动态 内 存 是 一 项 非常 困难 的 编程 任务 。 有 此 公共 领域 的 


X-Windows 应 用 程序 因 内 将 泄漏 而 臭名 咯 著 ， 承 像 Apple Computer 的 董事 会 一 样 ， 

系统 经 常 吕 以 使 用 不 同 的 malloc 函数 库 ， 有 些 人 在 速度 上 作 了 优化 ， 有 些 则 重视 空门 的 充 
分 利用 ， 另 外 一 些 则 希望 对 调 让 有 所 帮助 。 刍 入 命令 : 

man -ss 3c malloc 


可 以 浏览 主 文档 页 耐 , 观察 所 有 的 matioc 入 列 盟 数 . 确认 链接 到 了 正确 的 拓 数 库 .Solaris 
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C 专家 编程 


2.x 上 的 SPARCWorks 调试 器 右 - -个 扩展 的 特性 米 帮 助 检测 内 存 港 潭 ,和 它们 到 代 了 Solaris 1.x 
十 的- 一些 竺 殊 的 malloc 库 蝗 数 ， 





we rm PETE ET rnAimwmsrp srwtAWoww- Ne simmwinahnw rwantTe mmswveewwesvaelwApA marmarnvwananrvev oem mweomrT 


内 存 洪 泽 最 简单 的 形式 ,是 : 
Fer(i S07 Le LO Lr 
Eg = malioc (lo24),; 

这 是 软件 的 exxon valdex:、 它 把 你 绘 它 的 所 有 东西 都 泄漏 出 法 。 

在 每 一 次 成 功 的 选 代 之 后 ，p 的 内 容 被 改写 ， 它 原先 所 指向 的 那 块 由 存 便 “泄漏 ”了 。 

由 于 现在 不 存在 指向 它 的 指针 ， 它 既 无 法 被 访问 ， 也 无 法 被 释 训 ， 大 多 数 的 内 存 洪 汤 并 
不 像 改 写 惟 一 指向 该 块 内 在 的 指针 的 内 容 (在 该 块 内 存 释放 之 前 ) 那么 明显 ， 所 以 它们 更 难 
确定 和 调试 。 

在 Sun 公司 ， 出 现 了 -- 个 有 趣 的 和 printtoal 软件 有 关 的 和 案例。 公司 总 戟 Scott McNealy 
的 桌面 系统 上 安装 了 一 个 操作 系统 的 内 部 测试 版 本 *， 总 栽 先 生 很 快 注意 到 ， 过 了 几 天 以 后 ， 
他 的 工作 站 变 得 越 来 越 慢 ， 对 系统 进行 重启 后 问题 马上 解决 ， 他 报告 了 这 个 问题 ， 没 有 什么 
东西 能 比 一 个 公司 总 裁 作 出 的 Bug 报告 更 让 那些 工程 师 们 紧张 的 了 。 

我 们 发 现 ， 问 题 是 由 “brinttool” 租 发 的 ， 它 是 print 命令 的 窗口 界面 。 像 “printtool” 这 
样 的 软件 更 多 的 是 由 公司 总 裁 这 样 的 人 使 用 而 不 是 由 操作 系统 的 开发 者 使 用 ， 这 也 是 问题 未 
被 发 现 的 原因 。 删 除 prittool 程序 后 ， 内 存 泄漏 不 再 发 生 ， 但 是 使 用 ps -ju scatt 命令 后 显示 
printtool 只 是 引起 内 存 泄 湄 ， 它 本 身 的 体积 并 不 增长 .看 来 需要 观察 printtool 所 使 用 的 系统 
调用 。 

printtoo] 的 设计 使 它 分 配 一 个 命名 管道 (named pipe， 一 种 特殊 的 文件 ， 记 许 两 个 不 相关 
的 进程 进行 通信 )， 并 用 它 与 命令 行 printer 进程 通信 。 每 隔 数 秒 , 便 有 新 的 管道 被 创建 ， 如 果 
printtool 没什么 重要 的 东西 要 告诉 printer， 它 很 快 便 被 销 角 ， 内 存 泄 漏 Bug 的 真正 罪魁 祸首 
是 创建 管道 的 系统 调用 。 岂 创建 管道 时 ， 系统 便 分 配 一 些 内 核 的 内 硝 来 保存 vnode 数据 结构 ， 
用 于 控制 管道 。 但 是 ， 用 十 记 录 该 结构 的 引用 计数 的 代码 却 少 减 了 1 次 ， 

结果 ， 当 用 户 使 用 的 管道 的 真正 数目 减少 到 零 时 ， 引 用 计数 仍然 显示 为 1， 所 以 内 核 以 
为 该 管道 仍 被 使 用 。 这 样 ， 每 当 管 道 被 关闭 时 应 该 释放 的 vnode 便 永 远 不 会 被 释放 。 间 次 营 





” 油轮 名 ， 曾 引起 - 沈 涯 重 的 潮 油 事故 。1989 年 3 月 24 日 ， 它 件 阿 拉 斯 加 的 碟 廉 寺 了 海峡 舰 礁 ， 寻 至 1100 广 加 仓 的 原油 倾 光 
到 人 海中 ， 这 是 美国 有 有 史 以 来 最 注重 的 漏 油 事 件 。 一 洋 者 注 

” 事实 上 ,这 旦 - 个 很 好 的 主意 。 让 总 裁 先 后 运 行 软 件 的 早期 版 本 并 参与 内 部 刘 试 过 程 使 母 个 人 都 不 政 估 意 。 它 确保 高 导 簿 理 人 
员 对 产生 的 进展 以 及 取得 的 改进 趟 一 个 良好 的 汰 识 。 它 可 以 给 产 癌 . 工 程 师 香 供 去 掉 世 后 -一些 Bug 的 动力 和 资源 。 
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第 7 章 对 内 存 的 思考 


道 关闭 的 时 候 ， 内 核 几 言 宝 节 的 内 存 便 被 泄漏 累计 起 来 ， 每 日 数 以 MB 计 -只 需 两 到 三 
天 ， 便 立 以 使 总 裁 先生 所 使 用 的 系统 慢 得 像 乌 外 ， 

我 们 在 vnode 引用 计数 的 算法 中 修正 了 这 个 少 减 1 次 的 Bug， 于 是 常规 的 内 核 内 硼 便 按 
预想 的 那样 及 时 得 到 回收 .我们 还 对 printtool 进行 了 修改 ， 让 它 使 用 一 种 更 漂亮 的 算法 ， 而 
不 是 连 绽 不 断 地 每 隔 数 秒 向 printer 作 一 次 小 报告 。 内 存 港 湄 被 堵 上 上 了， 程序 员 们 大 大 松 了 一 
和 ,工程 经 理 的 脸 上 也 重新 出 现 了 美容 ， 而 治 裁 先生 又 可 以 使 用 printtoo 了 。 

操作 系统 内 核 同 时 动乱 管理 它 的 内 存 使用。 内 核 中 的 许多 数据 胡 吓 动态 分 配 的 ， 所 以 斋 
先 没有 国定 的 限制 。 如 果 -个 内 核 程 序 错 庶 直 起 内 存 刘 汤 ， 机 器 的 速 庶 便 会 慢 下 米 ， 有 时 想 
问 十 胸 挂 起 或 共 至 不 知 所 持 。 当 内 核 程 序 请 求 内 存 时 ， 它 们 通常 会 进行 等 待 ， 育 到 有 足够 的 
内 在 可 以 分 配 为 上 。 如 果 出 现 内 存 洪 漏 ,最终 可 能 导致 可 以 分 配 的 内 存 无 法 满足 内 核 的 震 要 ， 
结束 竺 个 内 核 程 序 部 无 限 鲁 地 等 待 一 一 于 是 机 器 便 被 扯 起 ， 内 核 中 的 内 存 鹿 沁 往 往 很 快 合 被 
发 现 ， 央 为 绝 大 多 数 内 核 程序 的 使 用 都 相当 频繁 ， 我 们 同时 确定 了 一 些 软件 工具 几 于 测试 和 
实行 内 核 内 存 管 理 。 


7.7 总 线 错误 


当 我 从 20 世纪 70 午 代 末 于 始 华 UNIX 上 编程 时 ， 和 许多 人 -- 样 ， 我 很 快 就 遇 到 了 两 个 
常见 的 运行 时 错误 : 

bus error {core dimped) 总 线 锥 误 (信息 沁 转 储 ) 

利 

segnoncation fault (core dumped) 你 错误 (信息 已 转 储 】 

时 这 两 个 错 谋 是 非常 折磨 人 的 ， 错误 信息 对 引 总 这 酚 种 错误 的 源 代 码 错误 首 没 有 作 简 
单 的 解释 ， 上 而 的 信息 并 ; 末 提供 如 何 从 代码 中 寻找 错误 的 线索 ， 而 卫 两 者 之 间 的 区 别 也 并 不 
站 十 分 清楚 ， 叶 至 今日 依 汰 如 此 。 

大 多 数 的 问题 帮 有 是 出 于 这 样 :个 事实 ; 错误 就 是 操作 系统 所 检测 到 的 异常 ， 而 这 个 异常 
是 尽 可 能 地 以 操作 系统 方 ' 更 的 原则 来 报告 的 。 总 线 错误 和 段 错误 的 准确 诛 内 在 不 同 的 操作 系 
统 版 本 上 各 不 相 问 。 这 里 ， 我 所 描述 是 运行 于 SPARC 架构 的 SunOS 出 现 的 这 两 类 错误 以 及 
产生 错误 的 原 琴 。 

当 硬 件 告诉 操作 系统 一 个 有 问题 的 内 存 引用 时 ， 就 会 出 现 这 疝 种 错误 。 操 作 系统 通过 向 
出 错 的 进 称 发 送 ， 个 信号 与 之 交流 。 信 号 就 是 一 种 事件 道 知 或 一 个 软件 中 断 ， 在 UNIX 系统 
编程 中 使 用 很 广 ， 但 在 应 用 程序 编程 中 儿 乎 不 使 用 。 在 缺 省 情况 下 ， 进 程 在 收 到 “总 线 错误 ” 
或 “ 段 错误 ” 售 呈 后 将 进行 信息 转 储 并 终止 。 不 过 可 以 为 这 些 信和 号 设置 -一 个 信号 处 理 程 序 
《signdl handlery， 有 几 于 修改 进程 的 缺 省 反应 。 

信和 叶 基 巾 玫 硬件 中 晰 而 产生 的 。 对 中 断 的 编程 是 非常 图 难 的 , 因为 它们 是 异步 发 生 的 (其 
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[专家 纺 程 0 
发 牛 时 间 是 不 可 预测 的 六 因此 ,信号 编程 和 放 不 也 古 很 团 礁 岁 : 可 以 通过 阿 语 往生 的 宇 奖 相 
和 头 交 件 usrincludeAsysAsignalh 了 和 解 遇 多 相关 门 全 以。 





编程 挑战 


在 PC 上 捕捉 信号 


现在 ， 信 号 处 理 函 数 是 ANS1C 的 一 部 分 ， 与 UNIX 一 样 ， 它 也 同样 适用 于 PC。 例 如 、 
PC 程 订 员 可 以 使 用 signal0) 函 数 来 捕 提 Ctrl-Break 信号 ， 防 止 用 户 用 这 科 方 法 中 断 程 序 . 

请 在 PC 上 编写 一 个 捕捉 [INT 1B ( Ctrl-Break ) 信号 的 信号 处 理 程 序 . 让 它 打 印 一 条 友好 
的 用 户 信息 但 并 不 退出 程序 

如 果 体 使 用 UNIX, 请 编写 一 个 信号 处 理 程序 , 这 样 在 收 到 controi-C {传递 给 一 个 UNIX 
进程 的 control-C 用 作 一 个 SIGINT 信号 ) 信和 号 后 程序 将 重新 启动 而 不 是 简单 退出 ， 可 以 使 用 
typedef 来 帮助 你 定义 信号 四 理 块 ， 详 见 第 3 章 有 关 声 明 的 描述 ， 
.在任 何 使 用 信 生 的 源 祥 件 中 ， 者 必须 在 文件 前 面 增加 一 行 #inchnde <singal.h>。 


这 条 信息 的 “core durp” 部 分 则 米 源 于 很 时 的 过 去 ， 导 时 所 有 的 内 存 郑 是 由 铁 氧 化 物 轴 
坏 (也 就 是 core， 指 磁 心 ) 制造 的 ， 半 导体 成 为 内 存 的 主 些 制造 材料 的 时 间 己 经 粘 过 了 十 至 
生 ， 和 人 “core” 这 个 词 仍然 被 用 作 “ 内 存 ” 的 折 义 癌 。 


7.7.1 总 线 错误 


事实 上 ， 总 线 错误 儿 乎 部 是 出 于 末 对 齐 的 请 或 写 引 起 的 。 它 之 所 以 称 为 总 线 错误 ， 是 内 
为 出 现 林 对齐 的 内 存 访问 请 求 时 ， 被 堵 骞 的 组 件 就 是 地 址 总 线 。 对 齐 (alignment) 的 意 起 就 十 
数据 项 只 能 存储 在 地 十 是 数据 寺 大 小 的 整数 倍 的 内 存 位 时 上 。 在 现代 的 计算 机 架构 中 ， 让 其 
是 RISC 架构 ， 部 需要 数据 对 章 ， 因 为 与 任意 的 对 章 有 关 的 额外 逻辑 会 使 整 个 内 存 系 统 由 大 
且 更 慢 。 通 过 过 使 每 个 内 看 访问 马 限 在 一 个 Cache 行 或 - :个 单独 前 页面 内 ， 可 以 极 大 地 简化 
《并 加 速 》 如 Cache 控制 器 测 内 存 管理 单元 这 样 的 使 件 。 

我 们 友 达 “数据 项 不 能 跨越 页 面 或 Cache 边界 ” 规 岂 的 方法 多 少 有 些 癌 接 ， 因 为 我 们 用 
地 址 对 齐 这 个 术 诸 来 陈述 这 个 问题 ， 而 不 是 直截了当 说 是 禁止 内 存 中 页 访问 ， 但 它们 涪 的 是 
回 一 回 事 .例如 ,访问 -个 8 子 节 的 double 数据 时 ,地址 内 允许 是 8 的 整数 倍 。 所 以 -个 doubie 
数据 可 以 存储 于 地 址 24、8008 或 32768， 伺 不 能 存储 于 地址 1006 (因为 它 无 法 被 8 整除 )。 
页 和 Cache 的 大 小 是 经 过 类 心 设 让 的 ， 这 样 只 要 遵守 对 章 规则 就 可 以 保证 一 个 诛 了 数据 项 不 
会 跨越 : -个 页 或 Cache 块 萨 边界 . 

这 种 数据 必须 对 章 的 存储 上 更 求 总 是 让 我 们 起 起 孩 时 的 游戏 ， 沿 着 人 行道 的 边 治 行走 ， 仁 
脚 不 能 磁 到 人 行道 石头 的 型 颖 上 ,“ 走 查 裂 经 上， 会 折断 你 祖母 的 荫 ” 丰 点 类 似 “ 提 取 林 对 齐 
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第 7 意 对 内 存 的 思考 


弛 进 数 据 然 后 低 声 识 咒 ,会 引起 个 总 线 错 说 %。 也 许 这 全 训 像 此 党 信德 学 说 或 其 他 伸 秘 的 东 
册 。 雯 共 全 党 秋 苹 感 的 华 龄 时 曾 被 一 个 Fortran WO 通道 吓 坟 。 一 个 会 引起 总 线 错误 的 小 程序 


上 二 
AL 3; 


Ur cha” allsl] 
int 
hu; 
int *P = (In ai .a[l-]); 


*D 12; yy pp 中 未 对 齐 的 地 址 会 引起 一 个 总 线 错误 

这 将 导 敏 一 个 总 线 销 关 ， 内 为 数组 和 int 的 联合 确保 数组 a 是 接 赂 int 的 4 学 节 对 齐 的 ， 
所 以 “atl1” 的 地 上 绰 告 定 示 按 int 对 章 。 然后 我 们 试 网 御 这 个 地 址 存储 4 个子 节 的 数据 ， 但 这 
ea 这 就 违反 了 规划 。 一 个 好 的 编译 器 发 现 不 对 章 的 情况 时 

会 发 出 敖 汪 ， 但 它 并 不 能 检测 到 所 有 不 对 齐 的 情况 。 

ee CA ee 
有 这 样 的 对 齐 要 求 ， 所 以 程序 员 对 它们 可 以 很 愉快 地 不 必 关 心 数据 对 章 ， 但 是 ， 当 他 们 把 一 
个 char 指针 转换 为 int 指针 时 ， 就 会 出 现 神秘 的 总 线 错 梁 。 凡 第 前 ， 当 检测 人 到-… 个 内 存 奇 偶 
检验 错误 时 也 会 产 汪 疝 线 错 误 。 ee 内 存 蕊 证 已 经 非常 可 车， 击 且 很 好 地 得 到 了 错误 检测 
和 修正 包 路 的 保护 ， 所 以 在 应 用 程序 编程 这 ~- 级 ， 奇 个 检验 错误 儿 乎 不 再 听闻 。 总 线 错 谋 也 
可 能 由 于 引用 一 块 物理 上 本 存在 的 内 存 引起 。 如 果 不 遭 迪 个 淘气 的 王 动 程序 ， 你 胃 怕 不 大 
要 能 遭 巡 这 种 不 硅 。 


7.7.2 段 错误 


段 错误 或 段 违规 (segmentation viotation) 应 该 已 经 很 清楚 ， 因 为 前 遇 对 段 模型 已 经 作 了 解 
释 。 在 Sun 的 矿 件 中 ， 上段 错误 是 由 于 内 存 管 理 单元 (负责 支持 虚拟 内 存 的 硬件 ) 的 异常 所 致 ， 
而 该 踢 常 则 通常 是 由 十 解除 引用 … 个 未 初始 化 或 非法 位 的 指针 引起 的 。 如 果 指 针 直 用 -个 并 
不 位 于 你 的 地 址 空间 中 的 地 址 ， 操 作 系 统 使 会 对 此 进行 上 涉 。 :个 小 型 的 会 引起 段 错误 的 程 
序 如 上下: 

i171t.*9: Se "0; 

*p = 17; /+* 引起 一 个 恨 错 误 */ 

一 个 微妙 之 处 层 ， 有 导致 指针 具有 井 法 的 值 通常 是 由 于 不 同 的 编程 错误 所 引起 的 。 和 总 线 
错误 不同 ， 段 错误 更 像 是 -- 个 问 接 的 症状 而 不 是 引起 错误 的 原因。 

一 个 更 糟糕 的 微妙 之 处 是 ， 如 果林 初始 化 的 指针 恰好 只有 未 对 齐 的 仁 “对 于 指针 所 要 访 
癌 的 数据 而 吝 )， 它 将 会 产生 总 线 错误 ， 调 不 是 段 错误 。 对 于 绝 大 多 数 架 构 的 计算 机 而 言 确实 
九 此 ， 因 为 CPU 先 看 到 地 此 ， 然 后 再 把 它 发 送 给 MMH 
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和 

编程 挑战 

人 EPE HVS I ESTIMA net oo or mmmoToTerryiervvyyvretwreieretpmeAs MOAN AN A fo NN A ers 
测试 使 你 的 软件 前 溃 


完成 上 面 的 测试 程序 没 ， 

试 斌 运行 它们 、 看 看 溪 作 系统 是 让 样 报告 这 些 Bug 的 . 

附加 分 : 编 与 一 个 信也 处理 程 序 来 柄 提 总 线 错误 和 段 错 误 信号 ， 让 它们 打印 一 条 对 用 户 
更 为 友好 的 信息 ， 然 后 退出 . 





DL A Ne -< 册 Am wweertrvivrvrerarop arswAspssvmmeriw sarasas wssresvewssssss ws.orivonvwy 


在 你 的 代码 中 ， 对 非法 指针 值 的 解除 引用 操作 可 能 会 像 上 面 这 样 显 式 地 出 现 ， 也 可 能 在 
库 疯 数目 出 现 〈 传 递 给 它 个 非法 值 )。 令 人 不 快 的 苹 ， 你 的 程序 如 果 进 行 了 修改 (如 在 调试 
状态 下 编 详 战 增加 额外 钠 户 试 语句 )， 内存 的 内 容 使 很 容易 改变 , 于 是 这 个 问题 被 转移 到 别处 
或 十 瞻 消 拓 。 段 错误 是非 证 难于 解决 的 ， 击 日 只 有 非常 硕 因 的 段 错 谋 4 会 一 直 存 信 。 "你 看 
到 同事 们 神色 严峻 地 带 着 迎 界 分 析 器 利 示 波 器 进入 测试 实验 室 时 ， 便 知道 他 们 肯定 过 到 了 走 
工 的 麻烦 。 


PA ee ve en a MVE TE TOI EI SRN TN a iewconsssvnrorwwvmwrr 
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va 


SunOS 中 的 一 个 段 违规 Bug 


最 近 ， 我 们 不 得 不 处 理 一 个 段 违规 问题 ， 错 误 发 生 于 ncheck 实用 程序 运行 于 一 个 受 损 的 
文件 系统 之 时 . 这 是 一 个 十 分 恼人 的 Bug， 因 为 在 绝 大 多 数 情况 下 ， 使 用 ncheek 的 目的 就 是 
为 了 检查 怀疑 有 所 损坏 的 区 件 系统 。 

问题 的 证 状 是 ncheck 无 法 运行 printf， 直 接 原 因 是 解除 引用 一 个 空 指针 而 引起 段 违规 ， 
导致 问题 的 语 身 如 下 : 

‘void}orintfi"*%®s", p->name)}; 

绝 大 多 数 Yoyodyne Software 公司 的 程序 员 新 手 会 用 一 种 哆 哑 的 方法 来 修正 这 个 问题 : 


iftp->name != NULL) 
{void}printfi"%Ss", Pp->name}):; 





PSS wp wmaeremr 
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else 
‘void}printf{t" (nuil})"}); 


不 过 ， 在 现在 这 个 情况 下 ， 可 以 改 用 条 件 操作 符 ， 它 即 可 以 简化 代码 ， 又 可 以 保持 引用 
的 局 部 性 : 
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twoldrorinti i SS", oD->nave ? -Ta | (risili"i?: 
许多 人 不 愿意 使 用 -? …- 这 样 的 条 件 操作 符 ， 他 们 认为 这 种 方法 很 容易 把 人 摘 混 .但 与 下 
面 这 个 这 语句 相 比 ， 条 件 提 作 符 似乎 更 合理 一 些 . 
if {表达 式 ) 表 还 式 非 沐 时 的 语句 ”elise 虞 这 式 滩 罕 而 的 诸 句 
表达 式 ?” 表 达 式 非 震 时 的 语句 : 表达 式 为 霍 时 的 语 名 
相形 之 下 ， 条 件 操作 符 颇 符合 直觉 ， 并 允许 我 们 高 高 兴 兴 地 在 一 行内 轨 下 代码 ， 而 无 需 
不 必要 地 使 代码 膨胀 ， 但 龙 ， 千 万 不 要 在 一 个 条 件 操 作 符 内 访 套 另 一 个 条 件 操作 符 。 如 果 这 
样 做 了 ， 你 级 快 就 会 发 现 委 想 明 自 代码 的 确切 意思 可 不 是 件 容易 的 事情 . 
通 党 导致 段 错误 网 几 个 直接 诛 因 ; 
， 解除 引用 - 个 包 信 非法 值 的 指 千 。 
。 解除 引用 一 个 空 指针 【常常 由 十 从 系统 程序 中 返回 空 指针 ， 并 林 经 检查 就 使 用 ) 
。 和 在 末 得 到 正和 代 的 权限 时 进行 访问 . 例如， 试图 往 个 只 恋 的 文本 上 段 存储 值 就 会 引起 段 


。 用 完了 堆栈 或 排 宝 间 【〈 患 拟 内存 基 然 巨大 但 绝 诗 无限)。 

下面 这 个 说 法 可 能 过 于 简单 ， 但 在 绝 大 多 数 架 构 的 绝 大 多 数 情 况 卡 ， 总 线 错误 意味 着 
CPU 对 进程 引用 内 存 的 - 些 做 法 不 满 ， 而 段 错 灵 则 是 MMU 对 进程 引用 内 存 的 一些 情况 发 出 
抱怨 ， 

以 发 生 频 率 为 序 ， 最 滩 可 能 导 笋 段 错误 的 党 多 编程 错 谋 是 : 

1. 坏 指针 值 错 误 : 在 指针 赋 人 之 前 就 用 它 来 引用 内 存 , 或 者 回 库 所 数 传送 ` -个 坏 指 针 ( 不 
要 上 当 ! 如 果 调 试 右 显示 系统 程序 中 出 现 了 段 错 误 ， 并 不 是 因为 系统 程序 引起 了 段 错误 ， 问 
申 很 吉 能 还 华 存 在 二 日 己 的 代码 中 )。 第 二 种 可 能 导致 坏 指针 的 原因 是 对 指针 进行 释放 之 乒 篆 
访问 它 的 肉 容 。 可 以 修改 free 语句 ， 在 指针 释放 之 后 再 将 它 置 为 空 值 。 

freeltp}); Pp = NIL 

这 样 ， 如 果 在 指针 释放 之 后 继续 使 用 该 指针 ， 全 少 程序 能 在 终止 之 前 进行 信息 转 储 。 

2. 改写 (overwritej 销 误 : 越过 数组 边界 写作 数据 ， 伯 动态 分 配 的 内 存 两 端 之 外 写 入 数据 ， 
或 改写 一 些 堆 管理 数据 续 构 《在 动态 分 配 的 内 存 之 前 的 区 域 写 入 数据 就 很 容易 发 生 这 种 情 
沉 )。 

五 = mallocft25b6)];) PE-1] = 0; DrI256] = 0; 

3. 指针 释放 引起 的 错误 : 释放 同 - -个 内 存 块 两 次 ,或 释放 一 块 末 曾 使 用 malloc 分 配 的 内 
存 ， 或 释放 仍 在 使 用 中 的 内 存 ， 或 释放 … 个 无 效 的 指针 。 -个 极为 常见 的 与 释放 内 存 有 关 的 
背 识 就 是 在 for(p = start; p; p = p -> next) 这 样 的 循环 中 达 代 一 个 链表 ,并 在 循环 体内 使 用 free(p) 
诸 句 。 这 样 ， 在 下 - 次 循环 欠 代 时 ， 程 序 就 会 对 已 经 释放 的 指针 进行 解除 引用 絮 作 ， 从 而 导 
致 不 可 预料 的 结果 。 
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如 何在 链表 中 释放 元 素 


在 遍历 链表 时 正确 释放 元 率 的 方法 是 使 用 临时 变量 存储 下 一 企 元 素 的 地 址 .这 样 就 可 以 
安全 地 在 任何 时 候 释放 当前 元 素 , 不 必 担 心 在 取 下 一 个 元 素 的 地 址 时 还 要 引用 它 , 代码 如 下 : 


Styter Tod *p;, *rtarty *tmps 
farip = gtart; om; EE = tmp) 


LmD = DD -> most 
treetp); 


FN Tm A BE NRA em 


软件 信条 





你 的 程序 空间 不 够 吗 ” 

如 果 你 的 程序 所 需 的 闪存 超过 了 操作 系统 所 能 提供 给 它 的 数量 ， 程 序 就 会 发 出 一 条 “ 段 
错误 ”信息 并 终止 ,可 以 用 一 种 简单 的 方法 把 这 种 段 错 误 与 其 他 基于 Bug 的 段 错误 区 分 开 来 ， 

要 型 清 程序 是 否 用 完了 堆栈 ， 可 以 在 dbx 命令 下 运行 该 程序 : 


S$ dbx a.cut 
dbx catch S13SSEGY 





idbx; run 

signal SEGY {segmertation violation} in <some_routine> at DxcfFo57708 
‘dbx where 

如 果 现 在 可 以 看 到 调用 链 ， 那 说 明 扒 栈 空 间 还 没有 用 完 。 

但 是 ， 如 果 看 到 像 下 面 这 样 的 东西 : 


tetch at JQxeffeT7att faiied -- 1/0 error 
{dbxi 


那么 ,堆栈 很 可 能 已 经 用 完 ， 上 面 这 个 十 六 进 制 数 就 是 可 以 提取 或 映射 的 堆栈 地 址 . 
你 也 可 以 尝试 在 C-shell 中 调整 堆栈 段 的 大 小 限制 。 


Zimit slLacksive 10 
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你 可 以 在 C-shell 中 调整 堆栈 段 和 数据 段 的 最 大 值 , 上 面 语 白 的 意思 就 是 把 堆栈 段 的 上 了 眼 
调整 为 {0KB。 试 一 下 给 你 的 程序 一 个 更 小 的 堆栈 值 ， 着 看 在 它 会 不 会 更 早出 现 段 错误 ， 笛 
试 试 给 程序 一 个 更 大 的 堆栈 值 ， 使 它 能 够 成 功 地 运行 ， 进 程 的 总 地 址 空间 仍然 受 交 接 史 大 小 
的 限制 ， 可 以 用 swap -5 全 令 查 看 交换 区 的 大 小 

妆 程 序 出 现 十 折 针 住 对, 什么 样 的 缩 果 都 有 有司 能 发 生 , 一 种 上 三 被 接受 的 说 法 是 ， 蝶 果 “ 众 
走 人 这”， 指 镍 将 指向 你 的 地 址 空 闻 之 外 ， 这 样 第 一 次 性 用 该 指针 计 就 会 合 程 序 进 行 仿 息 转 锁 
后 终 二 由 束 你 天 不 走运 ”， 指 针 将 指向 你 的 地 秘宝 问 志 内， 并 横 订 荆 改 全 ) 它 所 指向 的 内 
存 的 古 何 信息 ， 这 将 引起 聊 禾 的 Bug， 井 党 难以 捕 提 :近年 来 ， 市 场 上 出 更 了 : 些 优 秀 的 
有 具 软 侍 ， 可 以 帮助 解决 这 方面 的 问题 。 


7.8 轻松 一 下 一 “Thing King” 和 “页 面 游戏 ” 


下 出 这 节 内 容 是 出 Jastf Beryman 十 1972 所 号 ， 当 时 他 .| 作 二 MAC 1. 程 ， 并 运行 了 于 
斯 的 虚拟 内 存 系 统 之 …。Jeff 多 少 有 些 不 平地 评论 道 ， 他 所 有 的 作曲 由 唯 右 这 个 最 受 次 迎 ， 
流传 也 最 广 。20 多 年 过 去 了 ， 它 的 内 容 对 于 现在 仍然 适用 : 

这 个 说 明 是 一 份 正 式 的 非 工 作 场合 文档 ， 属 于 Project MAC Computer Systems Research 
Division。 它 应 该 被 复制 并 发 布 到 缺少 轻松 气氛 的 地 方 , 并 可 以 随 你 所 愿 企 其 他 的 出 版 物 中 四 
作 参 考 资料 。 

规则 

1， 每 位 选 于 有 几 玉 万 的 Thing。 

2. 所 有 的 Thing 都 保存 在 箱子 时 ， 每 箱 保存 4096 个 Thinpg。 位 于 同一 个 箱 了 里 的 Thing 
称 为 “ 箱 友 "。 

3. 箱子 虐 可 以 存放 在 车 问 中 ， 也 可 以 存放 在 仓库 时。 车 间 总 是 太 小 ， 无 法 容纳 所 有 的 箱 
-于 。 

. 总 共 只 有 -个 车 阅 ， 但 可 以 有 好 几 个 仓库 。 科 位 选 于 共 皮 车间 和 仓库 。 
， 每 个 Thing 都 有 自己 的 Thing 号 。 

.可 以 对 Thing 进行 锻压 ， 告 位 选手 轮流 进行 锻压 。 

. 只 能 锻压 自己 的 "Thing， 不 允许 锻压 其 他 选手 的 Thing。 

8. Thing 只 有 杰 车 间 里 时 才能 被 锻压 。 

9. 具有 Thing King 知道 某 个 Thing 是 位 于 车 问 中 或 仓库 下 。 

10. 一 个 Thing 未 被 稻 压 的 时 间 越 长 ， 它 就 变 得 越 脏 。 

11. 必须 道 过 Thing King 才能 得 到 工作 。 它 所 给 的 Thing 数 以 8 的 整数 偿 计 ， 这 样 可 以 
有 效 地 减少 维护 性 开销 ， 


~ 人 nh 上 
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12. 锻 诗 -个 Thing 的 方法 减 是 给 出 和 的 Thing 号 ;你 各 你 所 维 出 Thing 与 的 上 入 于 好 位 

车间 内 ， 它 就 可 以 立即 进行 颖 讨 。 杂 它 位 证 仓库 中 ，Thing King 扎 装 有 该 Thing 的 箱子 

rs 搬 到 车 间 内 。 如 于 车 名 内 己 没 有 空位 置 ， 它 就 选 坡 最 胜 的 箱子 ， 不 管 它 里 而 装 的 是 
你 的 Thing 或 其 他 选 于 的 Thing, 把 它 以 及 内 和 面 所 有 的 Thing 都 搬 到 仓库 跨 。 宰 出 米 的 和 位置 就 
存放 装 有 所 答 Thing 的 箱子 。 然 后 ， 你 就 可 以 对 该 Thing 进行 锻 斥 ， 和 而 你 并 不 知道 该 Thing 
原先 是 存放 在 仓库 十。 

13. 得 位 选 于 拥有 的 Thing 数量 与 其 他 选手 相同 ,Thing King 始终 知道 哪个 Thing 是 哪 售 
迹 手 的 以 及 该 轮 到 跟 和 位 选 于 进行 锯床 ， 所 以 你 不 可 能 意外 地 锻压 了 上 共 他 选手 的 Thing， 芭 使 
该 Thing 的 Thing 号 与 你 的 Thing 的 Thing 号 机 问 。 

说 阴 

1. 根据 传统 ，Thing King 坐 让 ”: 张 巨大 划分 成 数 段 的 扣子 地， 汐 边 是 一 此 页 i 
页 ”"), 它们 的 任务 起 协助 Thing King 记 作 所 有 的 Thing 位 于 何 处 以 及 它们 分 别 届 十 财 位 选 

2. 规则 13 的 “个 结果 就 是 在 各 场 游 戏 中 ， 每 位 选 于 的 Thing 号 部 类似， 如 使 选 
不 间 。 

3. Thing King 也 有 它 自 己 的 Thing, 共 中 有 些 也 像 其 他 Thing 一 样 米 回 移动 于 车 间 和 和 仓库 
之 间 。 但 Thing King 的 有 此 Thing 过 于 沉 重 ， 只 能 一 直 存 放 在 车 站 明 。 

4, 恨 据 给 定 的 规划 ， 经 常 被 锻压 的 Thing 更 可 能 被 存放 于 车 间 内 ， 商 不 经 党 被 稚 压 的 
Thing 则 更 可 能 被 放置 在 仓库 中 ， 这 出 日 于 效 党 方面 的 考虑 。 

Thing King 万 岁 ! 

现在 你 觉得 上 面 的 描述 校 之 下 面 的 非 窜 言 翻 详 版 是 不 是 殉 有 趣 …- 些 紫 ? 

规则 
. 每 个 进程 拥有 儿 六 方 的 “ 字 节 ”。 
学 贡 存 放 于 “页 中， 每 页 4096 个 字 节 。 倍 才 同 - -页 上 的 字 闻 具 各 “本 地 中 各 ”关系 。 
,页 可 以 存放 在 内 在 名， 也 可 以 存放 在 磁盘 中 内存- - 般 不 够 大， 无 法 容纳 所 有 的 页 ， 
. 总 共 只 有 -- 块 内 存 ， 亿 可 以 有 几 个 做 盘 ， 所 有 进 穆 共 剖 内 存 和 伐 航 。 
斜 个 字 节 都 有 上 站 已 的 “虚拟 地 址 ”。 
. 进程 可 以 对 - -个 字 节 进行 “二 用 操作 ”每 个 进程 轮流 进行 引用 媒 作 ， 
. 每 个 进程 只 能 引用 日 己 的 字 节 ， 不 能 引用 其 进程 的 字 节 。 
. 字 节 只 有 当 它 们 位 于 为 存 中 有 时 才 能 被 引用 、 
“虚拟 内 企管 理 措 ”知道 其 个 字 节 位 于 内 存 还 是 位 于 磁 条 。 
)， -个 字 节 不 被 引用 的 时 间 越 长 ， 它 就 被 称 为 越 “ 旧 ”。 

11. \ 须 道 过 虚拟 并 存 管理 器 得 到 字 节 。 它 所 给 的 字 节 数 娟 是 2 的 倍数 或 乘 方 数 ， 
这 有 助 于 减少 开销 。 

12. 进程 引用 字 节 的 方法 就 是 给 出 它 的 虚拟 地 址 。 如 时 进程 所 给 出 的 虚拟 地 址 恰好 位 于 
内 存 中 ， 屠 么 进程 就 可 以 立即 引用 它 。 如 果 它 位 于 磁盘 中 ， 虚 拟 内 存 管理 器 会 把 包含 谱 字 此 
的 页 移入 但 内存 中 。 如 果 内 在 空间 已 满 ， 它 就 寻找 内 本 中 最 旧 的 次 (可 能 是 该 进程 白 己 的 ， 
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也 可 能 是 其 他 进程 的 )， 批 它 换 到 磁盘 中 ， 腾 出 来 的 空间 就 存放 包含 你 震 要 他 节 的 页 。 然 后 ， 
进程 就 可 以 引用 该 子 节 ， 但 进程 并 不 知道 该 页 好 先 位 于 磁盘 中 ， 

13. 迁 个 进程 拥有 的 关节 的 虚拟 地 址 与 其 作 进 程 一 样 。 虚 拟 内 存 管理 将 始终 知道 谁 拥 右 
电 个 学 节 以 及 该 轮 到 谁 进 行 中 用 操作 ， 押 以 - -个 进程 不 会 无 意 引 用 其 他 进程 的 学 节 ， 基 使 两 
者 的 虚拟 地 址 相同 。 

说 明 

1. 根据 传统 ， 赔 拟 内 存 管理 器 使 用 一 张 很 全 分 段 的 表 ， 另 外 还 有 “页 表 ” 用 于 记 住 所 
人 有 下 节 的 位 置 以 及 它们 的 :EE 人 ， 

2. 规则 13 的 - :个 结果 就 是 各 次 运行 中 每 位 进程 的 虚拟 地 址 部 类 似 ， 既 使 进程 的 数 基 
所 变化 。 

3. 虚拟 内 存 管理 器 也 指 有 上 自己 的 一 些 学 节 , 它们 中 的 有 些 也 利 一 般 进 程 的 学 节 - 样 在 内 
存 和 磁盘 中 移 米 移 去 。 但 半 ， 它 的 有 些 字 节 使 用 频率 非常 之 高 ， 所 以 和 常 驻 内 存 。 

4. 过 照 上 述 规则 ,经营 被 引用 的 字 节 更 有 可能 被 存放 在 内 存 中 ， 丙 不 太 被 引用 的 字 节 则 
更 可 能 被 存放 在 磁盘 中 ， 这 可 以 提高 内 存 的 使 用 效率 。 

虚拟 内 存 管 理 器 万 岁 





捕捉 段 错误 信号 的 信号 处 理 程 序 


#include <signal.n> 
#include <stdio.h;» 
vo:d nandlerlint s) 


{ 
ifis == SIGBUS) printf('" now gct a bus error signal\n"); 
ifls == SIGSEGVW) PrintE( now got a segmentation violationr signal\n'}: 
if(ls == SIGIHT) printf{*" now got an i]legal instruction signal\rn"): 
exit (1} 
} 
maint) 
{ 
int *p = NUDL; 
signal (SICBUS, handler};} 
signal (SIGSEGY, handler); 
signal {SIGTI.L,, nandler); 
0 
} 
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运行 该 程序 ， 得 出 结彩 如 下 : 


纺 忌 .Gak 


TOw Sot a& segrontiatioan violacicn signal 


NA TN FRR TAN RA Ne rr 





注意 : 这 是 一 个 用 于 斤 学 日 的 的 例子 、ANSIT 标准 第 7.7.1,1 他 指出 ， 在 我 们 现在 这 种 情 


EE TT ovvw。 -weowwwrnrossyveervw 


解决 方案 


使 用 setjmp/longjmp 兴 信 号 中 恢复 


下 面 这 个 程序 使 用 set mp/longjmp 和 信号 处 理 . 这 样 ， 程 序 在 收 到 一 个 control-C { 作为 
SIGINT 信号 传递 给 UNIX 程序 ) 时 将 重新 启动 、 而 不 是 退出 。 


#include <setjmy.> 
#include <sigqgna...n» 
#include <staio 上 > 

jmp_buf buf; 

void handler (int. si 








{ 
ifis == SIGINT)Y printf{"now gort a SICGTIN: signal\n"),; 
longjmp (buf, i}; 
jx 没有 到 达 */ 
? 
maint) 
t 
signal (slIGIN., handler}.; 
if tsetjmp {buf})} 
{ 
printf{back in main\r"):; 
return 0; 
:else 
printft"fjrst time througn"}: 
lecop: 
7* 在 这 里 循环 ， 等待 ctrL-C */ 
goto loop; 
} 
运行 这 个 程序 ， 结 果 如 下 : 
名 a.out 
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tirest time through 
人 ^ now Sot a SLGINT signal 


rd eT RAN MN 4 


ee 

注意 :系统 并 不 支持 在 信 续 处 理 程序 内 部 调用 库 抑 数 ( 除 非 严 格 符合 栋 准 所 限制 的 条 件 )。 
如 果 信 号 是 在 第 一 次 使 用 printf 时 产生 , 那么 相信 号 处 埋 程 序 中 的 printf 函数 曙 对 这 仲 清 况 就 
会 陷入 困惑 。 我 们 在 这 里 使 用 了 投机 于 段 ， 因 为 观察 情况 要 化 的 最 好 方法 英 过 于 灾 生 斥 JO- 
你 在 需 实 的 代码 中 绝 不 能 使 用 这 种 伎俩 ， 记 位 了 吧 ? 
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第 
Ua 
= 
为 什么 程序 员 无 法 分 清 万 圣 节 和 圣诞 市 


你 是 否 已 经 受 够 了 你 的 工作 站 的 慢 速 度 ?” 想 不 想 让 你 的 程序 的 运行 速度 提高 一 倍 ? 

在 LNIX 系统 中 ， 可 以 像 下 面 这 样 做 ， 只 更 一 步 步 按 这 三 个 轻松 的 步骤 进行 即 可 : 

1， ee 
运行 的 那个 的 最 快速 度 还 可 快 

2, 把 你 的 代码 存 为 /kernelunix.c 了 

3. 运行 下 行 命令 

Ce -04 -a /kernel/unix /kernel Jnix.c 

然后 ， 重 新 启动 系统 ， 

就 是 这 么 简单 、 记 住 ， 贝 多 芬 就 是 用 C 话 言 编写 了 他 的 第 一 首 交 响 乐 


——A.P.L Byteswayp’s Big Book of Tuning Tips and Rughby Songs 


8.1 Portzebie 度量 衡 系 统 


汽 毕 加 索 评 论说 计算 机 并 不 有 趣 时 , 我 们 当然 知道 他 的 真实 日 的 只 不 过 想 让 更 多 的 人 关注 
他 的 痰 话 突 了 。 乞 术 肖 的 便 命 就 是 要 挑战 现 有 的 口味 ， 对 其 提出 质询 ， 战 至 少 要 在 每 次 点 菜 时 
得 到 正确 的 炸 世 服务 ， 内 此 ， 我 们 在 第 8 章 展开 一 个 计算 机 传说 中 程序 员 为 什么 不 能 分 清 万 圣 
节 利 圣诞 节 的 老 问 题 ， 实 在 是 再 合适 不 过 了 。 在 讨论 这 个 话题 之 前 ， 我 首先 要 所 一 个 举世 闭 名 
的 计算 机 科学 家 Donald Knuth 的 作品 .Knuth 教授 多 年 来 ~ 直 执教 于 斯 则 福 天 学 ,他 撰写 了 The 
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Art of Computer Programiming 这 部 参考 价值 极 铅 的 宏 幅 请 著 ， 并 设计 了 TeX 振 版 系统 : 

”个 鲜 为 人 知 的 事实 是 ，Knuth 教授 的 第 一 本 出 版 劲 并 不 趾 出 现在 位 品名 辟 、 视 角 馈 利 
的 科学 期 刊 上 ， 而 是 刊登 于 一 个 更 为 大 众 化 的 杂志 上 上。1957 年 6 月 ，Donald Kouth 的 The 
Potreebie Svstem of Weights and Measurey” 区 出 更 在 第 33 骨 MAD 大志 上 上。 企 这 篇 交 训 中 ， 
这 位 后 米 成 为 太 出 计算 机 嘻 竺 家 的 Donald Knuth 振 劣 地 模仿 了 当时 尚 届 新 鲜 事 物 的 公 翌 绕 旦 
人 衡 系 统 。Knuth 曾 万 的 大 部 分 文章 显得 证 加 保 宁 ， 0 浊 感 旬 近 憾 ， 并 想 池 求 ， 的 根源 。 
Potrzebie 系统 中 所 有 上 度 晶 衡 的 基本 川 法 郁 丁 以 从 厚 序 的 第 26 期 MAD 杂志 中 找 介 。 

Knuth 的 文 圣 提 借 坚持 使 用 那些 MAD 读者 更 为 狼 秋 机 芋 会 制 单位 的 二 进 制 贞 组 的 砷 4 
机 位 ， 如 botrzebies、waatmeworrys 和 axolotls。 对 许多 MAD 亲 志 的 读者 米 说 ，Knuth 的 

文帝 语 他 位 适度 地 介绍 了 公制 度量衡 系统 的 概念 。 当时 天 国人 并 不 沼 悉 Kilo、centi 以 及 其 他 

曰 公制 前 级， 所 以 Knuth 的 Potrzebie 文 为 人 们 理解 它们 销 平 了 道路. 如 果 Potrzebie 皮 
旦 衡 系统 揣 地 被 采纳 也 省 后 来 美 因 的 公制 度量 衔 的 试行 会 更 成 功 。 

和 Potrzbie 系统 一 样 ， 关 十 程序 员 无 法 分 清 万 半 节 和 圣诞 节 的 筑 话 也 依赖 十 纺 世系 统 的 
内 部 知识 :程序 员 无 法 分 清 万 对 节 和 圣诞 节 的 原因 是 八进制 的 31 等 于 十 进 制 的 23， 也 就 是 
说 10 朋 30 日 等 于 12 月 2511- 

我 给 Knuth 教授 写 了 ~- 封 信 ， 并 附 上 木 章 的 手稿 ， et | 澡 我 引述 这 个 上 事 : 他 不 
仅 表 未 问 意 ， 而 且 在 于 篇 汪 标 注 了 许多 校对 改进 意见 ， 于 指出 程序 员 也 无 法 把 11 月 27 日 则 
上 | 咎 这 琴 个 日 子 区 分 玉米 : 

术 草 精 选 了 一 此 类 和 似 的 也 是 依 瑰 丁 编程 内 部 知识 的 CC 洁 言 半 惯 川 法; 部 分 例子 是 们 行 一 
试 的 有 用 提示 ,另外 一 些 则 是 提醒 你 避 开 暴 烦 的 扩 折 典故 。 我们 从 一 种 轻松 愉快 的 方法 开始 . 
使 图 标 代 代 具有 身 撒 述 能 力 


8.2 ”根据 位 模式 构筑 图 形 


图 标 (icon) 或 者 图 开 (gjypm， 是 … 种 小 型 的 位 模式 映射 十 屏幕 产生 的 图 像 、-… -个 位 代表 图 
像 上 的 一 个 像素 。 如 果 个 位 被 设置 ， 那 么 它 所 代表 的 像素 就 是 “ 亮 ” 的 。 如 果 … 个 位 被 清 
涂 , 米 么 它 所 代表 的 像素 味 是 “ 拉 ?的 ,所 以 一 系列 的 整数 值 能 够 用 于 为 图 像 编 公 。 类 似 Jconedit 
这 样 的 上 具 就 是 用 丁 绘 医 的 ， 它 们 所 输出 的 是 -- 个 包含 “系列 整 型 数 的 ASCII 文件 ， 可 以 被 
个 窗口 程序 所 包含 。 它 所 仓 在 的 问题 是 程序 中 的 图 标 只 起 一 叫 | 六 进 制 数 ,在 C 语 关 由， 
典型 的 16X16 的 黑白 网 形 可 能 如 下 : 


”Knuth 孝 执 后 来 奖 认 ，The 4 ee 蔬 名 中 的 “Art” 是 指 与 他 长 捧 | 申 囊 的 Art Evans，1967 年 ， 当 这 儿 卷 必 开 始 山 现 
时 ，Knuth 在 Camegi Tech 举行 了 一个 专题 会 ， 会 上 Knoth 诗 论说 他 很 高兴 看 到 他 的 朋友 Ar Evans 也 在 场 ， 因 为 他 已 经 拉 这 于 
阁 书 以 他 的 名字 命名 ， ee 领悟 到 送 个 辣 作 剧 的 意思 时 ， 无 本 捧腹 大 笑 ， 币 Art 本 大 则 比 其 他 大 员 加 个 比 、 
后 米 ， 汪 nuth 获得 ACM 的 桥 灵 区 时 .他 在 图 开奖 的 Lecture 上 再次 提 到 了 和 rr， 和合 这 个 三 作 剧 进入 了 证 式 的 证 林寺 ， 称 可 以 
愉 Communications of the ACM, 第 668 页 ， 第 17 伏 ， 第 12 号 上 看 色 这 个 着 蜂 ，Ar 声称 “这 部 巨著 以 我 的 名 学 命名 并 没有 人 
我 的 生 汀 得 型 杰 多 改变 ， 
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static unsigned snort stLopwatct:i:] = { 

DOXD7C6， 

0Ox1PzY ， 

0x383B， 

DOx3002 ， 

NxbuOC, 

DxCons, 

OxCOUS, 

xDEFDR8 ， 

DXC1DS ， 

OxCiv6, 

OxS1.0C, 

Dx610C, 

0x3838， 

xlFTS, 

VXJ7C0, 

DOxXRDOD0 

] 

正如 所 看 到 的 那样 ， 这 些 C 语 次 常量 并 森 提 供 有 关 图 形 实 际 模样 的 什 何 线索 。 这 电 有 一 
个 惊人 的 #define 定义 的 优雅 集合 ， 多 许 程序 建立 常量 使 它们 看 上 太 像 站 谋 幕 上 的 图 形 。 

Hdasfine X }*2+l1 

tdsfine _ })*2 

Hdefine s (TOUCTIO 2* 用 于 建立 16 位 宽 的 图 形 */ 

定义 了 它们 以 后 , 上 共 芭 画廊 需要 的 图 标 或 图 形 等 , 程序 会 白 动 创建 它们 的 下 六 进 制 模式 ， 
使 用 这 些 居 定义， 程序 的 日 描述 能 力 大 人 人 加强， 上面 这 个 例子 可 以 转变 为 : 


statcic unsigned short stopwatchi] 


{ 

RR Re 
5_ XXXXXXXXX_ XXX, 
Se 人 
-PE ME 
SE pe 
Sa XK 二 
0 KR 
SR Re NR XX._, 
:i > 时 
:i > XX _， 
= SP 
So 
Se pe 
So 
DR bt ; 
5S 
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显然 ， 与 前 面 的 代码 烛 比 ， 它 的 意思 更 为 明显 ;标准 C 语 语 基 有 不 进 制 二 进 制 和 十 冯 
进 制 常量 ， 但 没有 --: 进 制 澡 最 ， 否 则 的 话 倒 是 种 再 为 简单 的 给 鼎 图 形 信 模式 的 并 流 ， 

如 果 抓 作 书 的 右上 上 角 , 并 斜 着 看 这 一 页 ,可 能 会 猪 测 这 起 个 内 于 流行 窗口 系统 区 Ycursor 
busy” 小 秒表 图 形 。 我 是 在 儿 年 前 从 Usenet comp.lang.c 浙 闻 组 党 到 这 个 技巧 的 。 

千 为 不 点 忘 了 在 绘图 结束 之 后 清除 这 些 必 定义， 仙 央 很 可 能 会 给 你 后 面 的 代 锐 喀 业 人 不吝 
预测 的 后 果 。 


8.3 ”在 等 待 时 类 型 发 生 了 变化 


住 第 1 音 时 , 我 们 提 人 到 了 当 操 作 符 的 党 作 数 类 型 木 -一 玫 时 会 发 生 类 岸 转换 这 被 称 为 “ 喜 
常任 术 转 换 ”， 它 负责 把 珀 个 不 同 的 操作 数 类 型 转换 成 同 -种 普 道 类 型 , 转换 后 的 类 型 ， 般 也 
就 是 结果 类 型 。 

C 语 所 中 的 类 型 转换 比 一 般 人 想象 中 的 茧 广泛 得 区 :在 涉及 类 型 小 于 int 或 double 的 去 
达 式 中 ， 都 有 可 能 出 现 类 型 转换 。 以 下 面 的 代码 为 例 : 

printf{" %d "，Size2f ‘A’'); 

这 行 代码 打印 出 存储 个 字符 字面 值 类 型 的 长 度 。 你 敢 确 定 它 的 结果 就 是 字符 的 长 度 ， 
也 就 是 1 出 ? 那 就 运行 一 上 代码 试 试 。 你 会 发 现 事 实 上 的 结果 是 4 【5 战 彰 是 你 机 器 上 int 的 区 
度 )。 学 符 常 量 的 类 型 是 pt， 根据 提升 规则 ， 它 由 char 转换 为 int， 这 个 概念 在 K&R 1 1i'! 讲 
得 过 于 简单 了 ， 它 在 第 39 页 是 这 样 描述 的 ; 

在 表达 式 中 ,每 个 char : 闻 被 转换 为 int.,, 注 意 所 有 位 于 表达 式 中 的 float 都 被 转 撞 为 double.. 
由 于 肖 数 参数 也 是 一 个 表达 式 , 所 以 当 参 数 传递 给 函数 时 也 会 发 生 类 型 转换 。 具体 地 说 ,char 
和 shert 转换 为 int， 而 float 转换 为 double。 





The C Programmineg lgase, 洲 旅 

这 个 特性 被 称 为 类 型 提升 。 当 它 发 生 干 整 好 类 型 时 称 为 “ 整 型 提升 "””ANSIC 延续 了 白 
动 类 型 提升 的 概念 ， 尽 管 在 许多 地 方 它 已 褪色 。 关 于 类 型 提升 ，ANSIC 标准 有 如 下 说 明 

在 执行 下 列 代 码 段 时 

char .cl Cs 

Pd 

三 1 第 "二 和 23 

“ 整 型 提升 ”规则 要求 抽象 机 器 把 每 个 变量 的 值 提 升 为 int 的 长 度 ， 然 后 对 两 个 int 值 执 

行 加 法 运 黄 , 然后 再 对 运算 结果 进行 裁 莫 .如果 两 个 char 的 加 法 运算 结果 不 会 发 生 溢出 异常 ， 
那么 在 实际 执行 时 只 需要 产生 char 类 型 的 运算 结果 ， 可 以 省 略 类 型 提升 ， 

类 似 ， 在 下 列 代码 段 中 


float fi1, £2; 
double 3; 
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Fe Np x 
于 ] = f2 * dd 
如 果 编 译 器 可 以 确定 用 float 进行 运算 的 结果 跟 转 换 为 double 后 进行 运 莫 ( 例如 , d 由 类 
型 为 double 的 常量 2.0 所 代替 ) 的 结果 一 样 ， 那 么 也 豆 以 使 用 float 来 进行 来 法 运算 。 
一 一 ANSIC 泵 滩 ， 抠 5.1.2.3 他 


表 8-1 提供 了 一 个 常见 类 型 提升 的 列 赤 。 它 们 可 以 出 现在 什 何 表达 式 中 ， 半 不 局 服 于 涉 
及 操作 符 和 混合 类 型 操作 数 的 表达 式 。 


表 8-1 C 语言 中 的 类 型 提升 

源 类 型 通常 提升 后 的 类 型 
D2 a 

位 段 (bir-field) int 

枚 举 (enumm) int 

unsigned char int 

short int 

unsigncd short int 

fioat double 

仔 何 数组 相应 类 型 狼 指 针 


整 型 提升 就 是 char、saort int 利 位 段 类 型 《无 论 signed 或 unsigned) 以 及 校 举 类 型 将 被 提 
升 为 int， 斯 提 是 int 能 够 完整 地 容纳 原先 的 数据 ， 否 则 将 被 转换 为 unsigned int，ANSI C 表 
小 如 果 编 译 涡 能 够 保证 运算 结果 一 致 ， 也 由 以 省 略 类 型 提升 
第 昌 操 作 数 的 时 候 。 





这 通常 出 现在 表达 式 中 存在 








警惕 ! 真正 值得 注意 之 处 一 一 参数 也 会 被 提升 ! 


另 一 个 会 发 生 隐 式 类 型 转换 的 地 方 就 是 参数 传递 . 在 K&R C 中 ， 由 于 函数 的 参数 也 
是 表达 式 ， 所 以 也 会 发 生 类 型 提升 。 在 ANSIC 中 ， 如 果 使 用 了 适当 的 函数 原型 ， 类 型 提 
升 便 不 会 发 生 ， 否 则 也 会 发 生 。 在 被 调用 函数 的 内 部 ,提升 后 的 参数 被 裁减 为 原先 声明 的 
大 小 ， 
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这 就 是 为 什么 单个 的 rintf() 格 式 和 罕 字 囊 %d 能 适用 于 几 个 不 同类 弄 ，short、，ehar 或 int， 
而 不 论 实际 传递 的 是 上 述 类 童 的 哪 一 个 ， 函 数 从 堆栈 中 【或 寄存 器 中 ) 取出 的 参数 总 是 int 
类 型 、 并 在 printf 或 其 他 被 调用 通 数 里 按 统一 的 格式 处 理 。 如 果 使 用 printf 来 打印 比 int 长 的 
类 型 如 Sun OS 上 的 long long. 就 可 以 发 现 这 个 效果 ， 除 非 使 用 long long 格式 化 限定 符 %ld， 
否则 无 法 获得 正确 的 值 . 这 是 因为 在 缺少 更 多 信息 的 情况 下 , printf 假定 它 所 处 理 的 数据 是 int 


OY A ET RN AANA DEE 


C 语音 中 的 类 型 转换 光 比 其 他 语 主 逻 为 常见 ,其 他 语 襄 往往 将 类 型 转换 只 用 十 操作 数 
上 ， 使 操作 符 陋 端 数 据 类 型 一致。C 语言 也 执行 这 项 任务 , 但 它 问 时 也 提升 比 规范 类 型 int 
或 deubte 更 小 的 数据 类 球 《即使 它们 类 型 凡 配 )。 在 隐 式 类 型 转换 方面 ， 有 王 个 重 虚 的 地 
方 调 要 注意 : 

。 隐 式 类 型 转换 是 语 寺 中 的 一 种 临 杞 手段， 起源 于 简化 最 初 的 编译 回 的 想法 。 把 所 有 的 
操作 数 转 换 为 统一 的 长 度 极 大 地 简化 了 了 代码 的 生成 。 这 样 ， 压 到 堆栈 中 的 参数 部 是 问 一 长 度 
的 ， 所 以 运行 时 系统 只 需要 人 知道 参数 的 数目 ， 市 不 需要 仙道 它 们 的 长 度 。 翅 所 有 的 浮 点 运算 
部 以 double 精度 进行 就 意味 着 PDP-11 能 够 简单 地 设 壮 为 double 运算 模型 ， 它 只 管 按 double 
精度 执行 运算 ， 无 需 上 顾 上 及 操作 数 的 精度 。 

。 中 使 不 至 琶 缺 省 的 类 型 转换 ， 也 可 以 用 C 语言 进行 人 量 的 编程 耳 作 ， 许 多 C 程序 员 
就 十 这 样 散 的 。 

*。 在 理解 隐 式 类 型 转换 这 档 子 事 之 前 ， 不 能 称 白 己基 专家 级 C 程序 员 。 隐 式 类 型 转换 
在 涉及 蜂 型 网 上 下 文中 显得 非常 重要 ， 请 看 下 一- 节 。 


8.4 原型 之 痛 


ANSI C 函数 席 型 的 几 的 是 使 C 诗 言 成 为 一 种 更 加 可 靠 的 语言 。 建 立 版 型 就 是 为 了 消除 
一 种 普通 《但 很 难 发 现 ) 的 错误 ， 就 是 形 参 和 实 参 之 癌 类 型 不 匹配 ， 

ANSIC 的 遇 数 展 型 不 是 未 取 一 种 狐 的 所 数 声 明 形 忒 ， 把 参数 的 类 型 也 包含 在 声明 之 
中 。 明 数 的 定义 也 作 了 相应 的 改变 以 瑟 配 声明 。 这 样 ， 编 谋 器 就 可 以 在 函数 的 声明 和 使 用 
之 问 进行 检查 。 为 了 更 好 地 记 作 两 者 的 区 别 ， 老 8-2 显示 了 新 有 旧 两 种 前 数 声明 和 定义 的 形 
式 。 


1 旭 使 个 原型 位 二 printfi) 能 故 的 帝 关 之 内 ， 注 意 它 的 原型 以 省 政 号 结 民 : 
irr printi {const char **ormar, .,..); 


表示 它 是 个 接受 叶 变 参数 个 数 的 梧 数 ， 参 数 的 信息 (除了 第 个 以 外 ) 沟 末 给 刷 ， 频 时 一 般 的 警 数 所 天 始终 会 发 生 ， 
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一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 


表 8-2 K&R C 的 函数 声明 与 ANSI C 原型 的 对 比 
K&R€C ANSIC 
占 明 : 原型 : 
int. foor}; int' omit a Tut bs 
或 


nu too'int, int);} 


宣 义 ; 定义 ， 
J oo la, DBD; int fociint a, int D) 
nt as 1 
nb BB; 
} 
} 


注意 ，K&R C 的 承 数 声明 与 ANSIC 的 函数 声明 ( 永 型 ) 不 同 ，K&R CC 的 防 数 定义 也 与 
ANSIC 的 图 数 定 义 不 同 ,可 以 在 ANSIC 中 使 月 int foofyoid); 这 样 的 形式 来 变 示 “ 没有 参数 光 
尽管 它 看 上 去 与 传统 的 C 不 一 样 。 

然而 ,ANSIC 并 没有 也 不 of 能 排 它 性 地 使 用 函数 原型 ， 因为 这 样 做 使 它 巨 法 兼容 数 以 -+ 
亿 行 计 的 在 ANSIC 之 前 使 已 存在 的 C 代码。 标准 并 没有 规定 在 也 数 志明 中 使 用 空 括 车 《 即 
木 指定 参数 ) 是 被 直 式 瞩 弃 和 的， 也 没有 说 明 继 续 使 用 这 种 形式 会 导致 与 标准 的 术 来 版 木 不 划 m 
容 。 在 可 以 顶 见 的 将 来 ， 闪 种 风格 将 会 并 存 ， 原 因 就 在 丁 现存 的 人 星 卓 式 代 码 。 记 以 ， 如 果 
浇 原 型 龙 个 “好 东西 ”那么 我 们 是 不 是 应 该 到 处 痢 使 用 它 ， 并 在 维 护 旧 式 代 码 时 为 它们 增加 
洲 数 原型 昵 ? 绝 非 如 此 ! 

天数 康 弄 不 仅 改 变 了 C 语言 的 语法 ,而 HH 引入 了 种 微妙 的 主义 区 别 〈 不 是 人 们 所 希望 
的 )。 从 前 面 一 节 中 得 知 ， 在 K&R C 中 ， 如 采 向 消 数 传递 一 个 短 十 jnt 的 整数 ， 了 于 数 实际 所 
接收 到 的 是 int， 如 果 传 递 的 是 一 个 float， 函 数 实际 接收 到 的 是 double。 在 被 请 用 上 前 数 的 晒 数 
体内 ， 这 些 什 会 根据 苑 数 定义 时 参数 的 声明 类 型 自动 越前 为 该 类 型 。 

此 时 ， 你 可 能 会 感到 困惑 ， 为 什么 要 不 嫌 朵 烦 将 它们 提升 为 更 大 的 类 型 ， 然 后 又 直接 把 
它们 裁 曾 为 康 来 的 大 小 呢 ” 之 所 以 要 这 样 做 ， 点 意 是 为 了 简化 编译 器 -一 所 有 的 东西 都 是 问 
一 长 度 。 如 果 只 固定 使 昌 几 种 类 型 ， 将 大 大 简化 参数 的 传递 ， 尤 其 是 在 非常 老式 的 K&R C 
编 泽 右 中 《不 能 传递 struct 作为 参数 )。 这 种 编译 器 内 允许 三 种 类 型 作为 参数 ，int、double 利 
指针 。 所 有 的 参数 都 统一 沟 标 准 长 度 ， 被 调用 函数 会 根据 需要 对 它们 进行 裁 时 。 

相 扩 ， 如 果 使 用 了 活 铬 原型 ， 缺 省 参数 提 逢 就 不 会 发 生 。 如 果 人 参数 声明 为 char， 则 实际 
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所 传递 的 也 是 char。 如 术 售 用 新 风格 的 函数 定 尖 (在 函数 各 后 而 的 拍 叶 内 给 出 参数 类 型 )， 编 
详 器 就 会 展 定 参数 是 准 箭 声 只 的， 于 是 使 不 进行 类 噶 担 和 开 ， 并 据 此 产生 代码 。 


8.5 原型 在 什么 地 方 会 失败 


我 们 市 要 考虑 4 种 情况 ; 

1. K&R C 函数 声明 和 K&R C 函数 定义 

能 够 顺利 调用 ， 所 传递 的 参数 会 进行 类 型 氟 

2.ANSIC 函数 声明 ‘不 型) 和 ANSIC 函数 定义 

能 够 顺利 调用 ， 所 传递 的 参数 为 实际 参数 。 

3. ANSIC 函数 声明 ， 原 型) 和 K&RC 函数 定义 

如 果 使 用 个 较 窜 的 类 型 就 会 失败 ! 明 数 调用 时 所 传递 的 是 实际 类 型 ， 而 前 数 期 章 接 履 

的 是 提升 后 的 类 型 。 

4. K&R C 省 数 声明 和 ANSIC 函数 定义 

如 果 使 用 一 个 较 罕 的 类 型 就 会 失败 ! 靖 数 调用 叶 所 传递 的 是 提升 后 的 类 型 ， 而 孔 数 期 旨 

接收 的 是 实际 类 型 。 

所 以 ， 如 果 为 一 个 K&R C 函数 定义 增加 孙 数 原型 ， 而 原型 的 参数 列表 中 有 一个 short 参 
数 ， 在 参数 传递 时 ， 这 个 原型 将 导致 实际 传递 给 困 数 的 就 是 short 类 型 的 参数 ,而 栋 据 函数 的 
定义 ， 它 期 望 接收 的 超 一 个 int 类 型 的 参数 。 这 样 ， 函 数 从 堆栈 中 抓 取 4 个 学 节 (inb 而 不 古 2 
个 字 节 (short)。 如 此 来 ， 不 素 与 short 参数 靠 在 一 起 的 那 2 个 池上 弛 便 无 府 地 成 了 垃圾 网 制造 
者 。 可 以 通过 在 原型 中 强迫 使 用 党 类 型 ， 从 而 使 代 公 在 第 3、4 两 种 情况 下 人 能 正常 运作 . 介 
这 种 做 法 不 仅 背 离 了 可 移 杰 性 原则 ， 而 且 会 给 维护 代码 的 程序 员 带 来 困 感 。 下 别 的 例子 最 示 
了 酚 种 失败 的 情况 . 

文件 : 

A* 上 风格 的 函数 定义 ， 但 它 却 其 有 原型 */ 

olddeft {d, i) 

floal ad: 

char 1; 

{ 

printf ("olddef: float = $%f, char = %x ‘\n", d, i); 

】 

/* 新 风格 的 定义 ， 但 它 祁 没有 原型 */ 

newdef tfloat d, cha i) 

{ 

printf{"newdef: float = %f, char = %x \n", d, i}; 

} 


文件 2 
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1* 旧 风 瑞 的 定义 外 它 具 有 原型 */ 


InL oiddef (float d, char i); 


maint) { 
float dd = .10.0; 
char j = 3; 


olcdef tg, Jj); 


/* 新 风格 的 定义 ， 但 它 没有 原型 */ 
newaef (d, j}; 


} 

期 望 输 出 结 

oldeaef: fioat = 10.0, char = 3 
newdef: float = 10,.0, char = 3 


实际 输出 结果 : 

olddef: float = 524288.000000, char = 4 

newdef: float = 2.562500, char = 0 

注意 ， 如 果 把 函数 的 定义 放 在 它们 被 调用 的 局 -- 个 文件 内 《这 里 是 文件 27， 程 序 的 行为 
在 会 个 一 样 。 编 详 器 将 会 检测 到 olddef0) 的 不 此 配 ， 内 为 它 现在 可 以 同时 看 到 原型 和 K&R C 
的 消 数 定义 。 如果 把 newdef0) 的 定义 放 在 它 被 调用 之 前 , 编译 器 就 会 平静 地 执行 正确 的 操作 ， 
因为 此 时 函数 的 定义 就 相当 于 原型 ， 它 保证 了 声明 和 定义 的 一 致 性 。 如 果 把 函数 的 定义 放 在 
它 被 调用 之 后 ， 编 译 器 就 会 发 出 “类 型 不 匹配 ”的 错误 信息 。 由 于 C++ 要 求 所 有 函数 必须 具 
备 原型 ， 你 可 能 会 想 用 C++ 编译 器 去 编译 那些 旧式 的 K&R C 代码 ， 在 编译 器 发 出 错误 信息 
的 地 方 逐个 为 函数 添加 原型 。 


编程 挑战 





如 何 使 原型 失败 
尝试 几 个 例子 ， 弄 清 想 这 里 所 涉及 的 内 容 。 在 一 个 独立 的 文件 里 创建 下 列 函 数 : 


void banana peellchar a, short b, float c) 


{ 
printflchar = %c, short = %d, float = $f \n", a, b, c): 


} 
在 另 一 个 独立 的 文件 里 ， 建 立 调用 banana peel() 的 主 程序 。 
1. 试 试 在 使 用 原型 和 不 使 用 原型 两 种 情况 下 调用 它 ， 再 试 试 在 原型 和 定义 不 匹配 的 情况 


177 


C 专家 编程 
下 调用 它 ， 

2. 在 每 种 情况 下 ， 在 运行 代码 之 前 预测 结果 。 编 写 一 个 union， 你 可 以 向 它 在 储 一 个 值 
却 取 回 男 一 个 值 (两 个 值 的 长 度 不 同 ) ， 检 测 你 的 预测 是 否 正确 . 

3. 参数 次 序 的 改变 ( 在 通 数 的 声明 和 定义 中 ) 是否 会 影响 被 调用 函数 接收 参数 的 方式 ? 


PTE ed dd a mr EE EA NEAAIN SANNA TT EAA A ENO A rr 


早 些 时 候 我 曾 提 介 原型 允许 编 详 器 检查 丙 数 使 用 和 和 志明 之 间 的 一 敏 性 。 即 使 不 曾 拒 旧 风 
格 '; 新 风格 混合 起 来 ， 这 个 用 途 也 绝 不 会 没有 用 武之 地 ， 央 为 淮 也 无 法 保证 函数 的 原型 肯定 
与 对 应 的 定义 匹配 。 在 实 和 东 编 程 中 ， 茂 们 通过 把 陋 数 永 型 放 短 在 头 文 件 中 ， 而 世 数 的 定义 则 
放置 在 为 一 个 包含 了 该 头 文 件 的 源 文件 中 来 防止 这 种 情况 的 发 生 ， 编 详 器 能 同时 发 现 它 们 ， 
如 右 个 匹配 就 能 检测 到 。 知 果 程 序 员 不 这 样 做 ， 烦 恼 很 快 就 会 站 他 效 米 。 





:小 启发 
外 





NEES MSA EE RR RAAT ER AAA TAP TRNA FN TOE A RE sa ee ae 


不 要 在 函数 的 声明 和 定义 中 混用 新 旧 两 种 风格 


坚决 不 要 在 函数 的 声明 和 定义 中 混用 新 旧 两 种 风格 ,如果 函数 在 头 文件 里 的 声明 是 K&R 
C 风格 的 ， 那 么 该 函数 的 定义 也 应 该 使 用 K&RC 风格 的 语法 . 


int foot{}:; ji Eo0{a, b}) int a; Th By A *: 
如 果 函 数 具 有 ANSIC 原型 ， 那么 在 它 的 定义 中 也 使 用 ANSIC 风格 的 语法 。 
int foolint a, jin* b); int foo{int a, Ent Db) { rr -xp } 





建立 - 种 可 靠 的 机 制 洲 检 查 跨越 多 个 文件 的 因 数 调用 还 古 能 够 做 介 的 。 在 printf 这 种 参 
数 数 且 不 定 的 两 数 中 需要 使 用 特别 的 技巧 〈 当 前 就 是 如 此 )。 它 其 全 可 以 应 用 十 现存 的 语法 。 
它 押 需要 的 就 是 在 标准 中 规定 每 次 调用 前 数 时 必须 在 参数 名 字 、 数 昌 、 类 型 以 太 函 数 的 返回 
类 型 上 与 函数 的 定义 保持 一 致 。 这 种 “预防 艺术 ”确实 存在 ，Ada 语言 就 是 这 样 做 的 。C 语 
言 也 可 以 使 用 这 种 方法 ， 不 过 需 竖 在 链接 器 之 前 进行 一 个 额外 的 传递 。 重 要 提示 : 使 用 lint 

在 实践 中 ，ANSI C 委员 会 的 成 员 们 在 扩展 C 语言 方面 相当 谨慎 一 一 或 许 有 些 保守 了 。 
企 Rationale 中 记录 了 他 们 为 是 省 应 该 去 除 现 有 的 外 部 名 宁 只 有 前 6 个 字符 才 有 意义 并 是 大 小 
号 不 敏感 的 限制 而 痛苦 不 安 的 情形 。 最 后 ， 他 们 决定 不 去 除 这 个 限制 ， 这 使 得 一 些 读 言 专家 
觉得 他 们 多 少 有 些 软弱 。 或 许 ANSI C 委员 会 在 这 方面 也 应 该 做 - 科 努 力 ， 规 定 一 个 完整 的 
解析 过 程 , 即使 它 在 链接 器 之 前 需要 进行 一 次 传递 。 应 该 放弃 C++ 那 种 繁琐 的 部 分 解析 过 程 ， 
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并 日 规定 日 己 的 约定 、 潜 法 、 诸 义 和 限 市。 


8.6 不 需要 按 回 车 键 就 能 得 到 -个 字符 


MS-DOS 程序 员 在 转 到 UNIX 系统 之 后 最 先 提 出 的 问题 之 -就 是 “我 如 何在 不 扫 下 
加 车 的 情况 下 从 终端 读 取 一 -个 字符 ? ”在 UNI[X 中 ,终端 输入 在 缺 省 情况 上 下 是 被 * - 锅 端 ” 
的 ， 也 吴 是 说 整 行 输入 是 被 一 起 处 理 的 , 这 样 行 编辑 字符 (backspace, defete 等 ) 吕 以 不 通过 
正在 运行 的 程序 就 能 发 挥 作用 。 遂 常 , 这 是 :种 人 们 所 希望 的 方 重 办 法 , 们 它 也 意味 着 在 
读 入 数据 时 必须 按 -- 上 同 车 键 表示 输入 行 结 下 后 才能 得 到 输入 的 数据 ,这 种 方法 对 症 和 行 


便 了 上 。 

这 个 “一 次 输入 一 个子 符 的 ”特性 对 二 许多 种 类 的 软件 来 涪 部 十 非常 量 娄 的 ， 代 对 于 
PC 谭 兰 却 是 小 菜 一 伴 。C 因数 库 支 持 这 个 特性 ， 通 党 使 用 … 个 称 作 kbhitO) 的 上 质数， 如 果 
个 车 符 下 在 等 待 被 读 取 ， 筷 就 会 发 出 提示 。Micersoft 和 Borland 的 C 编译 器 提供 了 
getchQ( 或 getche0， 它 可 以 使 字符 在 读 取 的 同时 回 显 于 嵌 莫 上 ) 米 获 收 单个 字符 ， 认 不 用 
等 待 整 行 结束 。 

人 和 们 经 常 感到 疑问 ， 为 什么 ANSI C 不 定义 一 个 标准 的 函数 来 获取 一 次 按键 后 的 字符 . 
由 十 没有 “种 标准 的 方法 ， 每 个 系统 都 采用 了 不 同 的 方法 ， 这 样 便 使 程序 失去 了 可 移植 性 。 
及 对 将 kbhit0) 纳 入 林 准 的 人 认为 : 它 在 绝 大 多 煞 情 况 下 是 用 于 游戏 软件 的 ， 而 且 还 存在 其 他 
许多 未 标准化 的 终端 yO 特性 ， 另 外， 你 可 能 并 不 想 要 一 个 在 其 些 操作 系统 中 很 难 实现 的 标 
准 库 函 数 。 赞 成 它 纳 入 标准 的 人 人 则 认为 ， 它 在 绝 大 多 数 情 况 下 用 十 游戏 软件 ， 而 游戏 编写 者 
并 个 再 要 很 多 的 盘 要 标准 化 的 其 他 终端 VO 特性 。 不 论 你 支持 哪个 观点 ， 事 实 上 X3J11 小 组 
还 是 错过 了 一 个 使 和 语言 成 为 “ 代 学 生 程序 员 竺 UNIX 上 编写 游 烧 的 一 种 选择 的 机 会 (就 是 
未 吸纳 这 个 特性 )。 





游戏 软件 比 一 般 人 想 茹 的 要 重要 得 多 。Microsoft 意识 到 了 这 一 点 ， 经 过 深思 熟 虑 之 后 ， 
他 们 在 所 有 的 游戏 软件 中 提供 了 一 个 “老板 键 ”。 当 你 用 眼角 的 余 光 扫 描 到 老板 正 悄悄 迫近 
时 ， 只 要 一 按 老板 键 ， 游 戏 瞬 闻 即 会 消失 。 当 老板 走 过 你 的 终端 边 时 ， 你 好 像 正在 聚精会神 
地 工作 一 般 。 我 们 仍 在 寻找 一 种 老板 键 ， 它 可 以 使 MS-Windows 崩 演 ， 露 出 它 底层 那 套 真实 
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C 专家 编程 
的 窗口 系统 ,...,. | 


在 UNIX 中 ， 有 两 种 方法 可 以 实现 逐 字 符 的 输入 ， 一 种 很 难 ， 一 种 很 容易 。 容 易 的 方法 
就 是 让 stty 程序 米 实现 这 个 功能 。 尽 管 它 是 一 科 间 接 实 现 的 方法 ， 但 对 程序 而 言 并 无 人 但 。 

#include <stdio0,h> 

maint) 

i 

i Cy 


/* 终端 驱动 处 于 普通 的 一 次 一 行 模式 */ 


system{"stty raw"); 


/* 现在 终端 驱动 处 于 一 次 一 字符 模式 */ 


tC = getchart{}; 


system{"stty cookead"},; 

j* 终 堪 驱动 又 回 到 一 次 一 行 模式 wy/ 

} 

最 后 一 行 system(“'stty cooked"); 是 必要 的 ,因为 程序 结束 后 , 终端 字符 驱动 特性 的 状态 将 
延续 下 去 。 在 程序 把 终端 克 为 … 种 滑 重 的 模式 之 后 ， 如 果 不 作 修 改 ， 它 就 会 始终 处 于 这 种 模 
式 。 这 和 设 半 环 境 挛 量 明显 不 同 ， 后 者 在 进程 结束 后 白 动 消失 。 

把 IO 设置 为 raw 状态 可 以 实现 阻塞 式 读 入 (blocking read)， 如 果 终 端 没 有 字符 和 输入， 进 
程 就 一 直 等 待 ， 直 到 有 学 符 输 入 为 止 。 如 果 需 要 非 阻塞 式 读 入 ， 可 以 使 用 iocdO(IO 控制 } 系 
统 调用 。 它 提供 一 个 针对 终端 特性 的 良好 控制 层 ， 可 以 告诉 你 在 SVr4 系统 下 是 徊 有 一个 键 
被 按 下 。 下 面 的 代码 使 用 了 ioctiO， 这 样 只 有 当 -- 个 字符 等 待 被 读 入 时 进程 才 进 行 读 取 . 这 
种 类 型 的 1/O 被 称 为 轮 询 ， 就 好 像 你 不 断 地 询问 设 备 的 状态 ， 看 看 它 是 否 有 学 符 监 传 给 你 。 

#include a ie hy 

int kbhit 1) 

{ 

int is 
ijoctl1{0, FIONREAL, &i}; 
return if f/* 波 癸 可 以 读 取 的 字 答 的 计数 值 */ 


bi 

局 

CT 

nn 
[| 


， 作者 这 旬 话 具有 讽刺 味道 , 意思 是 windows 系统 具 不 过 是 模仿 了 其 他 的 窗口 系统 ， 如 果 有 -一 个 老板 键 - 按 ， 它 奢 层 华 朋 外 太一 
脱落 ， 其 本 质 就 可 能 是 别人 的 窗口 系统 〔Apple 的 Mac) 。 一 译 者 注 
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Systenmi"stty rew -echo"); 
prirtii"anter ‘GG’ 0 GUI sn}; 
EO 

CEDbELE(YY) + 

= qetcekar'l, 

printfi"\n got. $e, on laration SSG" Cc, i}}; 


} 
sysl.eaemi"stty Coakec ccho"y}: 


ONAN TA ET EAA A a 





RN rE RN 


调用 库 函 数 之 后 检查 errno 


每 次 在 使 用 系统 统 调用 ( 如 ioct]()) 之 后 ， 检 查 一 下 全 局 变量 crmo 是 一 种 好 的 做 法 ， 它 
求 属于 ANSI C 标准 。 

如 果 一 个 库 函 数 调用 或 系统 调用 遇 到 了 问题 ， 它 将 会 设置 errno 的 值 以 提示 问题 的 原因 
然而 , 只 有 当 确 实 出 现 问 题 的 时 候 ，errno 的 值 才 是 有 效 的 一 一 库 函 数 或 系统 调用 会 使 用 某 种 
方法 来 提示 这 一 点 (一般 是 通过 它 的 返回 值 ) 。 

一 个 典型 的 用 法 大 致 如 下 : 

errno = 局 

iElioccl to, FIONREAD, &1) < 0) 

{ 


“1(erzno == EBAPT)} printf{t"errno;: bad Sile rumber'): 
i lerrno == EINYAL} printfi"errno: irvalid argumert'"};:} 


人 可 以 按 自己 的 音 好 尽 可 地 做 得 花哨 一 些 ， 并 把 检查 过 程 封装 在 一 个 单一 的 通 数 中 ， 当 
调试 程序 时 它 会 在 每 次 系统 调用 之 后 自行 调用 ,这 个 方法 在 隔离 错误 方面 确实 大 有 帮助 。 当 
你 知道 确 有 错误 发 生 时 ，， 时 ， 库 医 函数 perror0) 可 以 扩印 出 错误 信息 


et 





TE RT A NN NT ET A Rm hm NN 


如 果 你 对 这 种 单字 符 IO 感 兴趣 ， 你 常常 也 可 能 会 村 另外- : 些 显示 控制 感 兴趣 ，curses 
盟 数 库 为 它们 提供 了 各 种 不 同 的 可 移植 的 程序 。curses ( 令 人 联想 到 “eursor (光标 )") 是 - 
个 屏 带 管理 调用 明 数 库 ， 首 所 有 流行 的 平台 上 均 得 介 实 现 ， 下面 使 用 curses 取代 stty 对 上 区 
的 main 此 数 进行 改写 ; 


/* 使 四 curees 函数 库 和 前 面 定义 的 kbhit 1) 国 数 *y 


maint) 
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C 专家 编程 
{ 


i ~ 上 了 了 人 
I 入 三 = 


initscr 人 i; 1/# 初始 化 27.rses 图 数 好 
CDbreak ly 
Doccbhcr ij J/* 核 键 时 不 在 习 幕 上 回 显 字符 */ 


IIVPTIREwI，0，"Bresas ‘gq Lo Guitsanl li 
refresh(l'; 


whilets J=. 0") 

if (kbhit (ty) 
c - getchar1); /* 不 会 阻塞 ， 因 为 我 人 知道 有 -- 个 空谷 正 碍 等 待 */ 
mpPrintwtl, 0, ‘got. char ‘%c’ or iteratior Sd neCG，--11， 
rsftresh’i}); 


naocbreaki}: 
echot{),; 
endwirii); /+ 结束 crses */ 

} 

州 cc foo.c -lcruses 命令 进行 编译 。 你 应 该 注意 到 使 用 了 curses 之 后 , 输出 结果 笑 常 清 页 . 
有 -一 本 叫 作 UNIX Cruses Explained 的 NutSheti 类 型 的 好 书 ( 这 绝 不 是 - :本 很 多 人 往复 中 的 程 
序 员 们 一 拿 起 米 就 会 品 娘 长 书 ) 很 好 地 描述 了 curses 师 数 库 。curses 孙 数 府内 提供 了 基于 他 
符 的 请 硕 控制 函数 ， 与 特 是 的 位 鼎 射 图 形 窗 口 化 沟 数 库 相 比 ， 攻 curses 裔 数 库 编写 的 软件 在 
数量 上 要 少 得 多 ， 但 几 它 编写 的 软件 在 讨 移 植 性 方向 却 要 蝇 得 多 

最 和 站， 还 和 存在- -种 非 力 询 读 取 方 式 ， 合 当 操 作 系统 准备 好 “ 些 输入 时， 就 会 给 你 的 进程 
发 送 ~ 个 信和 上 与 。 

如 崇 程 序 使 用 了 中 断 张 动 的 WO， 当 它 不 处 理 输 入 时 可 以 在 main 请 数 蝶 执行 … 些 其 他 的 
处 理 。 如 果 输 入 比较 零散 E. 程 序 还 有 许多 其 他 事务 要 处 理 ， 这 呈 -种 非常 有 效 的 资源 使 及 方 
式 。 中 断 皮 动 程序 要 复杂 得 多 ， 使 它 正常 运转 的 难度 也 大 得 多 ， 但 它 可 以 使 进程 更 有 效 地 售 
用 CPU 时 间 ， 而 不 是 白白 浪费 时 间 - - 直 等 待 输 入 。 现 在 ， 随 着 线程 的 进一步 使 用 ， 人 们 以 对 
中 断 张 动 TO 的 使 用 也 日 益 减 少 ， 


一 -一 一 > 


编程 挑战 





As imorvg 让 PE mm- 





在 你 的 系统 中 编写 一 个 中 断 驱 动 的 输入 程序 
中 断 驱 动 的 输入 是 MS-DOS 中 令 人 耳目 清新 之 处 。 系统 提供 了 这 些 简朴 的 服务 ， 你 很 容 





i 





A 
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和 多 把 它们 殷 到 一 边 ， 直 接 从 LO 端口 采集 字符 。 在 SVr4 中 ， 需 要 做 下 列 工 作 : 

1. 创建 一 个 信号 处 理 程 序 浮 数 ， 当 操作 系统 发 送 “ 字 符 已 经 就 绪 ” 的 信号 后 ， 它 就 被 调 
用 以 读 取 该 字符 。 这 个 需 引 捕捉 的 信号 是 SIGPOLL. 

2. 信号 处 理 程序 应 该 读 入 一 个 字 特 ， 它 每 次 被 调用 时 都 对 自身 进行 重 置 . 让 它 在 屏幕 上 
回 显 刚 读 取 的 字符 ， 如 里 试 入 的 字符 是 “gq” 就 退出 。 注 意 : 这 仅 适 用 于 教学 性 质 的 程序 。 在 
实际 工作 中 ,如果 在 信号 处 理 程序 内 调用 了 任何 标准 兄 数 库 的 函数 , 其 结果 通常 是 未 定义 的 . 

3. 调用 ipetl()， 通 知 澡 作 系 统 每 次 从 标准 输入 时 需要 向 你 发 送 一 个 信号 。 查 看 steamio 
的 手册 页 ， 你 将 需要 一 个 [_SETSIG 命令 ， 参 数 为 S_RDNORM. 

4. 一 旦 信号 处 理 程序 建立 后 ， 程 序 可 以 做 其 他 的 事 ， 直 到 输入 到 达 。 为 输入 设置 一 个 计 
数 器 ， 在 处 理 程序 函数 中 霜 印 出 计数 器 的 值 。 

每 当 键盘 发 送 字符 时 ，SJGPOLL 信号 会 发 谤 到 进程 中 . 信和 号 处 理 块 将 读 取 该 字符 ， 并 对 
由 用 进行 重 亚 ， 以 借用 于 下 一 次 处 理 ， 


rv PEE PANNA ee dd A ee eh NN NN NEAT OE I A 


8.7 用 CC 语言 实现 有 限 状 态 机 


有 了 腿 状 态 机 (finjle state machine) 是 一 个 数学 概念 ， 如 果 把 它 运 川 二 程序 中 ,nf 以 发 挥 很 人 
的 作用 。 它 是 一 种 协议 ， 四 十 厂 限 数量 的 子 程 富 状态”) 的 发 展 变 化 。 往 个 了 程序 进行 一 
些 处 理 并 选 撞 下 一 种 状态 《通常 取决 于 下 一 段 输 入 )、 

有 限 自动 机 (FSM)uJ EA 用 作 程 序 的 控制 结构 。FSM 对 寺 焊 些 共 于 输入 的 在 儿 个 不 同 的 可 
达 动 作 中 进行 循环 的 程序 龙 共 合适 。 投 币 售 货 机 就 是 :个 FSM 的 好 例子 ， 它 只 有 “接受 硬 
币 尖 “选择 商品 ”“ 发 送 商 名 ”和 “ 找 零钱 ”等 数 种 状态 。 它 的 输入 丰 硬 市， 和 输出 是 待 舍 商 
he 

它 的 基本 思路 吓 用 - 张 表 保存 所 有 可 能 的 状态 ， 并 列 届 进入 每 个 状态 时 可 能 执行 的 所 有 
动作 ， 其 中 最 后 一 个 动作 就 是 计算 〈 通 常 在 当前 状态 利 卜 次 输入 字符 的 基础 上， 只 外 再 经 
过 一 次 表 查 询 ) 下 一 个 应 该 进入 的 状态 。 你 从 一 个 “初始 状态 ”开始 。 在 这 一 过 程 中 ， 翻 译 
家 可 能 会 告诉 你 进入 了 一 个 错误 的 状态 ， 表 示 一 个 预期 之 外 的 或 错误 的 输入 。 你 不 停 地 在 各 
种 状态 间 进 行 转换 ， 直 到 到 达 结 束 状态 ， 

不 CC 语言 中 ,有 好 儿 种 方法 可 以 用 来 表达 FSM, 但 它们 绝 人 多 数 都 是 基于 盖 数 指针 数组 。 
一 个 申 数 指针 数组 可 以 像 下 面 这 样 声明 ， 

VOLG 人 yxStateIMAX_STaAnES]) () 

如 采 知 道 了 了 因数 各 ， 就 可 以 像 下 面 这 样 对 数组 进行 初始 化 。 


extera int a(l}), b'}, cc(}), di(); 
in: i*statel|}() = { a, b, ¢, d}; 


可 以 通过 数组 由 的 指针 来 调用 函数 : 
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(otatetLly} ts 

所 有 的 崩 数 必须 接受 区 样 的 参数 , 并 返 癌 同 种 类 型 的 返回 值 (除非 你 把 数组 元 素 做 成 “个 
联合 )。 函 数 指针 是 很 厂 趣 的 。 注 意 ， 我 们 甚至 可 以 去 挥 指针 形式 ， 把 上 而 的 调用 成; 

staceli;i): 

其 全 

{**#w*#State[i])(); 

这 是 一 个 在 ANSI C 中 流行 的 不 良 方法 : 调用 贿 数 条 通过 指针 调用 也 数 《 战 任意 层次 的 
指针 间接 引 几 ) 叮 以 使 用 同一 种 语法 。 至 杆 数组 ， 也 有 一 个 对 应 的 方法 。 这 种 做 法 进 一 滑 起 化 
了 本 米 就 有 缺陷 的 “上 钻 央 与 使 用 相似 ”的 设计 哲学 。 


PTRTE ENDON AEE PE MIP EP PE LE TOI TINA DB OT AE pre AEE ENA TERRA A NAN a ia -rr nrivwesmswesero rmeraamme 
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RA dm eC ebb hb ee 大 时 时 乓 康明 下 丰 w sthnyeieiivieehuh ( 洒 由 由 weia 人 NVS -rrammmmrmmenirew mvavisewsswxeauvarremesiassmrrv emawnesmssirwewv 


编写 一 个 FSM 程序 


用 有 限 状 态 机 实现 第 3 章 所 档 述 的 C 语 言 声 明 分 析 器 。 

1. 回顾 第 63 页 图 3-3“ 分 析 环 ”。 这 是 一 个 简单 的 状态 机 图 ! 用 这 种 方法 为 其 编写 程序 、 
也 许可 以 通过 修改 第 3 章 曾 经 写 过 的 cdecl 程序 (你 应 该 写 过 这 个 程序 ， 是 不 是 ? ) 。 

2. 首先 编写 代码 来 控制 状态 的 转换 。 让 每 个 动作 程序 简单 打印 一 条 信息 ， 显 示 它 已 被 

用 ，。 对 它 进 入 深入 的 调试 。 

3, 增加 代码 ， 处 理 并 爷 析 输入 的 声明 。 

分 析 环 是 一 个 简单 的 状态 机 ， 它 的 绝 大 多 数 状 态 转 接 都 是 按 连 续 的 顺序 进行 的 ， 与 给 入 
无 关 。 这 意味 着 不 需要 建立 一 个 转换 表 用 于 匹配 状态 /输入 以 获得 下 一 个 状态 你 可 以 用 一 个 
简单 的 变量 { 类 型 为 函数 指针 ) 。 在 每 种 状态 下 、 需 要 做 的 事情 之 一 就 是 给 下 一 个 状态 赋值 。 
在 主 循环 中 ， 程 序 将 调用 指针 所 指向 的 函数 ， 并 特 环 往复 ， 直 到 结束 函数 被 调用 或 遇 到 一 个 
错 庶 的 状态 。 

基于 FSM 的 程序 和 不 是 基于 FSM 的 程序 在 易 编 码 性 和 调试 方面 该 如 何 比较 ”是 根据 哪 
种 程序 更 易于 增加 一 个 不 同 的 动作 ， 还 是 根据 哪 种 程序 更 易于 修改 动作 出 现 的 次 序 ? 


ee 





如 果 你 想 干 得 源 亮 点， 可 以 让 状态 函数 返回 一 个 指 间 通用 后续 昂 数 的 指针 ， 并 把 它 转 
换 为 地 当 的 类 型 。 这 样 ， 不 不 击 监 企 局 变量 了 .如 果 你 不 急 搞 得 太 花 晓 ， 可 以 使 用 :个 switcb 
诗句 作为 “种 简朴 的 状态 机 , 方法 是 赋值 给 控制 变 虹 并 把 switch 语句 放 丰 循环 内 部 . 关 十 FSM 
还 有 最 后” 点 需 上 归 谤 明 ;， 如 果 你 的 状态 函数 看 上 去 由 要 多 个 不 同 的 参数 ， 可 以 考虑 使 用 个 
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参数 计数 器 和 - -个 宁 符 串 指 针 数 组 ， 就 像 main 函数 的 参数 - : 样 。 我 们 熟悉 的 int argc，char 
*argy[] 机 制 是 非常 普 廊 鸭 ， 可 以 成 功 地 应 用 在 你 所 定义 的 也 数 ! 中 '。 


8.8 软件 比 硬件 更 困难 


你 古 否 觉得 软件 和 硬件 的 名 学 卉 反 了 一 一 软件 很 容易 修改 ， 但 在 共 他 的 各 个 方面 邦 比 砌 
件 显得 网 困难 '? 因为 软件 是 如 此 的 难于 上 二 发 并 获得 正确 的 结果 ， 作 为 下 序 员 ， 我 们 需要 找到 
尽 册 能 容易 的 方法 。 其 中 -种 亡 法 (适用 于 所 有 语言 ， 上 汶 不 腿 十 C 语 妆 ) 就 是 使 代 公 便 十 讲 
试 。 当 你 编写 程序 时 ， 提 供 debugging hooks。 





debugging hooks 


你 知 不 知道 绝 大 多 数 调 试 器 都 允许 从 调试 器 命令 行 调用 函数 ? 如 果 你 拥有 十 分 复杂 的 
数据 结构 上 时， 它 将 会 非常 有 用 。 可 以 编写 并 编译 一 个 函数 ， 用 于 遍历 整个 数据 结构 并 把 它 
印 出 来 。 这 个 函数 不 会 在 代码 的 任何 地 方 被 调用 ， 但 它 却 是 可 执行 文件 的 一 部 分 。 它 就 是 

“debugging hooks” ， 

当 调试 代码 并 停 在 菜 个 断 点 时 ， 你 可 以 很 容易 地 通过 手工 调用 你 的 打印 函数 来 检查 数据 

个 榴 的 完 村 性 ， 如 果 你 生计 过 这 各 方法， 就 会 它 一 直 符 记 在 心 、 百 出 它 委 可 能 斌 坦 没 。 


仁 前 商人 节 时 ,我 们 己 经 提示 了 可 调试 性 编码 。 我 们 建议 在 为 FSM 编 与 代码 时 使 用 此 个 
明显 的 阶段 : 首先 进行 状态 转换 ， 并 只 有 当 它 们 处 十 工作 状态 时 才 提 供 动作 。 不 要 扎 淄 蝶 开 
发 (incremental developmenty 和 “ 显 式 代码 调试 (debugging code into existence)j” 混 为 - 谈 ， 后 
音 是 程序 员 新 手 或 那些 开发 时 间 非 常 紧 的 程序 员 常 常 采 用 的 -种 技巧 。 显 式 代 色调 试 就 十 首 
先 鲍 促 地 编写 一 个 程序 框架 ， 然 后 中 在 接 下 来 几 膨 的 时 间 里 通过 修改 无 法 运行 的 部 分 对 程序 
进行 连续 的 完善 ， 直 到 程 谭 能 够 工作 。 问 时 ， 任 何人 如 果 要 依赖 系统 组 件 ， 可 能 会 总 得 发 疯 。 
“Sendmail” 和 “make” 契 两 个 广为人知 的 被 认为 原先 是 显 式 代码 调试 的 程序 。 这 就 是 为 什么 
它们 的 命令 语言 是 如 此 地 考虑 不 周 和 难 于 学 习 。 并 不 仅仅 十 你 认为 这 样 ， 所 有 人 部 觉得 它们 
很 麻烦 。 

可 凋 试 性 编码 意味 着 把 系统 分 成 几 个 部 分 ， 先 让 程序 总 体 结构 运行 。 只 有 基本 的 程序 能 
够 运行 之 后 ， 你 才 为 那些 复杂 的 细节 完善 、 性 能 调整 和 算法 优化 进行 编码 ， 


， 英文 中 hard 妈 呆 以 表示 “ 迄 ”， 义 可 以 表示 “ 刚 难 ”， 作 者 语义 双关 ， 详 青 注 
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华丽 的 散 列 表 


散 列 (Hash) 表 是 一 种 提高 访问 表 中 数据 元 素 的 方法 。 它 不 是 线性 地 搜索 表 中 的 元 素 ， 而 
ee 
是 还 过 精心 地 向 表 载 入 元 素来 实现 的 ， 人 
Rn 
表 的 长 度 减 一 的 值 ， 它 就 是 所 需要 存储 的 数据 的 索引 。 
如 果 这 个 位 置 已 经 被 别 的 元 素 占 领 ， 那 么 就 从 这 个 位 置 起 继续 向 前 搜索 ， 直 到 找到 一 
空 的 位 置 。 
另 一 种 解决 位 置 冲突 的 办 法 是 建立 一 个 链表 ， 挂 在 这 个 位 置 的 后 面 ， 所 有 散 列 函数 值 为 
这 个 位 置 的 元 素 都 添加 到 这 个 链表 中 (可 以 从 链表 基部 插入 ， 也 可 以 从 此 部 追加 ) .甚至 可 
以 在 这 个 位 置 后 面 再 挂 一 个 散 列 表 。 
当 查 拷 一 个 数据 项 时 ， 不 需要 从 表 中 第 一 个 元 素 起 换个 查找 ， 而 是 先 产生 该 数据 项 的 散 
列 涵 数值 ， 并 根据 这 个 值 找到 表 中 相应 的 位 置 ， 并 从 该 位 置 开 始 查找 该 数据 项 ， 
散 列 表 是 一 种 被 广泛 使 用 和 严格 测试 过 的 表 查 找 优 化 方法 ， 在 系统 编程 中 到 处 都 有 它 的 
宗 影 ; 数据 库 、 操 作 系统 和 编译 器 . 
如 果 我 搁浅 到 一 个 蕊 岛 上 ， 并 只 被 允许 带 一 -种 数据 结构 ， 那 我 党 无 疑问 选择 散 列表 。 


re 


我 的 一 位 同事 需要 编写 一 个 程序 ， 要 求 在 某 一 地 点 存储 每 个 交 件 的 文件 名 和 机 天 信 息 。 
数据 存储 十 - -个 结构 表册 ， 他 决定 使 用 散 列 表 : 这 时 就 需要 用 到 可 调试 性 编码 。 他 并 不 椒 : - 
步 辣 玉 ， 一 次 完成 所 有 的 任务 。 他 首先 让 最 简单 的 情况 能 够 运行 ， 上 就 起 散 询 函数 总 是 返 站 | 一 
个 0。 这 个 散 列 函数 如 卜 : 
A* hash_file: 占 位 符 ， 为 将 来 更 复杂 的 程序 留 下 位 置 “*/ 
int hash_ filename (iar *s) 
{ 
return 0} 
} 
调用 这 个 散 列 卫 数 的 代码 如 下 : 
J 
* find_file: 定位 以 前 建立 的 文件 描述 符 ， 需 要 时 可 以 新 建 一 个 
Ff 

file ting_fiiename!-har *s} 

{ 


int Fhash_valuc = hasn_filename!s); 
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file £; 
fo tf - fiie has’:_ cabie[fhacsh, yaluci; fF f= RNIT FE = 二 -i flinkl i 
izZtatraempt{f -: sname, 3s) == 3AMEY 1 
retarn' .ts 
} 
} 


/* 文件 未 找到 ， 建 立 -- 个 新 文件 */ 
f = aliocatle tileils),; 
f .> fink = file hasn_ tablelhash valuel]: 
[Lile hasn tableihash value] - 工 ; 
reLur ff; 
+ 
它 的 效果 就 像 吓 “个 散 列 表 还 水 被 使 用 。 折 有 的 匹 系 都 存储 在 第 杰 个 位 置 后面 的 链 雪 中 
这 使 得 程序 很 容易 调试 ， 因 为 无 需 计 算 散 列 盟 数 的 具 汪 值 。 这 个 项 级 程序 员 很 快 就 完成 了 程 
序 的 剩余 部 分 ， 人 为 他 不 沉 要 担心 散 列 的 相 握 作用。 当 他 对 主 程序 的 宇 美 运行 感到 心满意足 
以 后 ， 义 者 于 采取 了 一 些 优化 措施 ， 并 决定 激活 散 列 上 走 。 这 是 一 种 在 单个 函数 路 进行 的 双 线 
和 修改。 下面 是 当前 所 位 用 的 代码 ， 他 总 结 为 “brain, pain, gain 〔 出 痊 、 靖 苦 、 收 获 )”， 
int nash_filenime ‘crar *s] 
{ 
1nt length = strien{s): 
retarntlength + 4 * {si10 + 4 * gflength:7?j})} % FILE _ YASH:; 
} 


有 时 候 ， 花 点 时 间 拒 编程 问题 分 解 成 几 个 部 分 往往 是 解决 它 的 最 快 方法 。 


To sd ro TT TT I -yu wpvrpo sunny 
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re re OA EE AA A ee LN NT 2 PF a NT SN NA 


编写 一 个 散 列 程序 


键入 上 面 的 代码 片断 ， 并 补足 必要 的 类 型 说 明 、 数 据 和 代码 ， 使 它 能 像 程序 一 样 运行 ， 
然后 ， 显 式 调试 它 (这 可 是 件 恐怖 的 事 ) ， 


Ta rr rr a EA SE ST FF FH ER EWE Er TER ER ED EPE hr wee rr 


8.9 如 何 进行 强制 类 型 转换 ， 为 何 要 进行 类 型 强制 转换 


“强制 类型 转换 (cast:” 这 个 术语 从 C 语言 一 诞生 瓯 开始 使 用 ， 既 几 于 “类 型 转换 *， 也 用 
于 “消除 类 型 歧义 ”。 如果， 编号 了 下 面 这 样 的 代码 ; 
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‘floarn) 3 
它 器 是 - -个 类 型 转换 ， 而 日 数据 的 实际 二 进 制 位 发 生 了 了 改变 。 如 果 ， 这 样 与 ; 
ifJioat)y .NW 
承 用 于 消除 类 型 歧义 ， 这 样 编译 器 十 以 从 一 开始 就 选用 正确 的 们 模式 。 有 上 正人 认为 它 
之 所 以 命名 为 蝇 制 类 型 转换 是 因为 它们 可 以 把 有 些 东 廿 宰 得 不 完整 ， 
可 以 很 窗 易 地 把 某 种 类 型 的 数 担 强制 转换 为 基本 类 形 的 数据 :在 拓 殷 里 写 ]. 新 类 型 的 名 
称 《 如 inb， 然 后 把 亿 们 放 厢 市 要 转换 类 型 的 胡 达 式 新 面 。 件 强制 转换 一 个 更 为 复杂 的 类 型 
时 ,转换 的 方法 并 个 是 夫 么 显而易见 。 例 如， 你 有 :个 void 指针 ， 并 知道 它 事 实 上 包 售 了 
个 立 数 指针 ， 彤 么 旭 何 在 一 条 语 各 中 进行 类 型 转换 并 凋 用 该 旺 数 呢 ? 
复 当 的 类 型 转换 可 以 按 下 面 的 3 个 步骤 编写 : 
1. 一 个 对 象 的 吉明 ， 它 的 类 型 就 是 想 要 转换 的 结 玉 类 蜡 ， 
2. 删 去 标识 符 ( 以 及 任何 如 extern 之 类 的 存储 限定 符 ，， 并 把 镜 余 的 内 容 放 在 一 对 折 芒 
里 。 
3. 把 第 2 步 产生 的 内 容 放 在 表 要 进行 类 型 转换 的 对 象 的 五 边 。 
作为 一 个 实际 例子 ， 程 部 员 们 经 常 发 现 他 们 需 上 坚强 制 类 型 转换 以 使 使 用 qsort0 床 冰 数 。 
这 个 库 半 数 接收 4 个 参数 ， 其 中 一 个 是 指 加 比较 蚌 数 的 指针 ，qsortO 攀 数 声明 如 下 : 


void gsort {void basc, size_t nel, sizea_l widttk, 
int (*compary foorst void*, const void *);},; 
当 调 用 qsortO) 明 数 时 ， 可 以 向 它 传递 一 个 你 押 喜 欢 的 比较 明 数 ， 你 的 证 较 打数 将 接收 实 
际 的 数据 类 型 而 不 是 void* 参 数 ， 就 像 下 面 这 样 : 
inL irtcompare(const int *i, const int *j} 
{ 
return(*i ~ *:) 1? 
这 个 未 数 并 不 与 qsort0 的 compar(O 参 数 完全 匹配 ， 所 以 需要 进行 强制 类 型 转换 。 让 :我们 
假定 有 - -个 整数 数组 ， 它 其 行 10 个 泡 素 ， 需 归 对 它们 进行 排序 。 根 据 鞋 面 列 出 的 3 个 步骤 ， 
叮 以 发 现 对 sqort0 的 调用 将 会 是 下 | 血 这 种 样子 ; 


dqsort.{ 
已， 
19， 
Silzeof lint}, 
(Ane (*) {const void *, const void *)} lintcompare 
); 


”如 果 你 的 计算 机 属于 行为 比较 翌 异 ， [5 且 也 不 太 流 行 的 那 种 ， 它 的 指针 长 度 根 据 它 所 指向 的 类 型 而 异 ， 这样 你 将 不 得 不 在 你 的 
比较 应 数 内 进行 强制 类 型 转换 ， 而 不 是 在 讽 数 调用 时 。 如 不 有 可 能 的 话 ， 赶 紧 转 移 到 个 更 好 的 计算 机 染 构 上。 


188 


第 8 章 为 什么 雅 序 商 无 法 分 清 万 淮 节 和 圣诞 节 
作为 一 个 不 实际 的 例 六 ， 你 可 以 建立 个 指向 如 printtO 之 类 的 阴 数 的 指针 ， 使 放 


extearn int Brini ieccnetL chary， 


Void *- = (void*)psirtt; 
这 样 束 可 以 通过 : -个 经 过 适当 类 型 转换 的 指针 来 调用 printfO) 遇 数 了 ， 方 法 如 下 ; 
《TY (oonse Char*, oI)f) "Bite my Short3 Also ry chars ard iatLen"}; 


8.10 轻松 一 下 一 一 -国际 C 语言 混乱 代码 大 赛 


C 语言 结合 了 汇编 语言 的 所 有 威力 和 汇编 语言 的 所 有 骨 用 性 
RI 


对 二 任何 编程 说 闸 ， 你 都 可 以 用 -种 粗暴 的 方法 来 使 用 它 。 绝 人 多 数 的 优秀 程序 只 部 能 
写 册 一 些 非 凋 艰 兆 的 代码 ， Ot Oe a er RE 
序 员 们 看 ， 打 赌 他 们 猜 不 则 代码 的 功能 。 有 些 代 人 码 时 般 6 个 月 以 后 连 白 己 也 不 知道 它 是 用 来 
士 仁 么 的 。 可 以 用 什 何 语 基 来 编写 这 类 程序 ， 介 使 用 C 语言 似乎 更 容易 达到 这 个 日 的 ， 

图 际 C 洁 言 混乱 代码 大 赛 (IOCCC) 臣 :一 硕 人 年度 部 赛 ， 白 1984 年 以 米 上身 延 续 人 至今， 它 川 
Landon Curt 和 Larry Bassel 在 USENET 上 举办, 它 源 丁 Landen 陪读 了 Bourne shell 的 源 代 码 
之 后 所 发 具 的 感叹 :“ 大 电 ! 这 太 过 份 了 . ”他 开始 想象 ， 如 果 有 总 把 C 诸 言 的 代码 开 得 混乱 
不 堪 (而 不 是 在 实际 编程 中 侦 尔 出 现 的 创作 用 >， 到 底 能 达到 什么 程度 。 

大 赛 撒 成 了 一 年 - 度 的 传统 。 冬 天 接收 参赛 作 昌 ， 奔 季 进 行 评判 ， 夏 天 的 Usenix 会 议 上 
公布 猴 胜 省 。 带 第 全 10 种 类 型 的 效用 者 :“ 对 规则 的 最 奇 翌 的 浇 用 ”， “最 具 创 意 的 汶 代 公布 

疝 “最 优秀 的 单行 代码 ”等 。 综 合 性 的 “最 佳 上 镜 ” 奖 授 了 最 难 岗 谈 、 行 为 最 为 古怪 《但 
能 够 运行 》 的 C 程序 的 作者 ， 

IOCCC 有 很 多 令 人 捧 揽 之 处 , 而 且 它 能 够 以 令 人 忆 异 的 方式 扩展 你 的 知识 ， 不管 你 是 自 
行 编写 过 是 事后 分 析 获 胜 癌 的 代码。 例如 ，1987 年 ， 丰 尔 实 验 室 的 David Kom 提交 了 下 而 这 
个 锋 奖 作品 

maini}y { prirtf (gyrix[*\021%siz\012\0°], (uzixi| “have"] + *fun” - Dx6D) ， } 

它 提纯 的 是 什么 东 贞 i 提示: 它 跟 “havye fun” 无 关 ) David 编写 了 与 Boume he 
名 的 Korn shell， 它 被 广泛 认为 比 第 7 版 的 /bin/sh 清楚 得 多 ，: 人 概 是 由 杆 IOCCC 扮演 了 
济 的 角 伍 ， 于 洛 们 已 经 痛 阐 快 快 地 发 挥 了 回 ， 所 以 就 不 想 在 实际 代码 里 所 化 样 了 。 

1988 年 的 获胜 者 臣 cdeel 程序 的 一 个 混乱 版 本 ， 作 者 是 Gopi Reddy。 回 想 下， 非 泡 乱 
的 cdecl 程序 大 概 用 了 150 行 代 公 ， 而 这 个 混乱 版 本 的 代码 只 有 12 行 

#incirGe<stdio.h; 


linciudexctype.h> 
#define w priritf 
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C 专家 编程 


tdefine »b whiie 

#define ts {WwW =- Tis)) 

char *X,*B,*b,Il93] :MW, VD() {WwW==92 1w ("ta es VA tid;:., 
DI),t(d1)): W4223(t7 ,Di ,wptr oo MOrpiw--A0? tro ,weirfure reLurnirgy 
"ht{a4l)}):W==91?(t10)==322 (wl"array 0..%4] of “yarzoi (x}-1}) ,L(tOi} w(trarrdy ot 
tt93)) 0) ;7 Iman} {otwi"input: sj ae 
Dll ,wig.*s. rn Mb , }TIs) {if (ls|lis=-=W) {p(t*B--9| 1*3==37) RB-+; X= V0;:f (w=-isa 


Phal*B)?9:icsdigit(*B) 732:*Br+) if (W330 (isalnum(*R SUTT eurrl W;'! 


这 类 过 度 使 用 ?和 , 操作 符 的 洋 合 代 公 ,用 现在 的 日 光 米 看 显得 并 不 戈 特别 有 有 创意。 但 在 
当时 ， 这 种 做 法 非常 新 命 ， 而 且 能 够 使 壬 序 的 代码 变 得 今 人 吃 己 地 简洁 。 至 十 上 面 这 段 代 而 
是 如 何 工 作 的 ， 就 留 给 读 潜 好 好 分 析 吧 。( 瞪 ! 我 总 是 想 这 么 说 ) 首先 要 找到 卫 个 子 程序 . 
TO 逢 ! DO。 前 者 负责 才 找 下 一 个 标记 并 确定 它 是 标识 符 、 数 字 还 是 其 他 人 东 此 ， 后 少 负 责 分 析 
过 程 。 请 试 着 把 这 些 代 码 灵 译 成 旧 泥 乱 的 代码 ， 先 用 访 处 理 器 运行 ， 拒 有 关内 容 格式 化 为 诛 
来 的 形式 。 然 后 把 所 有 的 ?表达 式 改 写 为 站 语 人名。 循环 御 复 ， 直 到 代码 清晰 叮 污 为 ||。 

本 章 最 后 一 个 混乱 C 代码 例子 是 一 个 BASIC 解释 器 , 作者 是 伦敦 大 学 的 研究 年 Diomidis 
Spinellis， 他 只 用 了 大 约 1500 个 字符 就 完成 了 这 个 程序 ! 程序 附 有 -- 个 指导 手册 ， 解 释 了 如 
何 使 用 解释 器 ， 并 提供 了 … 个 BASIC 程序 实例 。 





DDS-BASIC 解释 器 (1.00 版) 


直接 命令 : 
RUN LIST NEW BYE ”QLD 文件 名 SAVE 文件 名 
程序 命令 : 


变量 名 A 到 了 QZ 变量 在 RUN 时 被 初始 为 0 
FOR var = exp TO exp NEXT 变量 

GOSUB exp RETURN 

GOTO exp IF exp THEN exp 

INPUT 变量 PRINT 字符 串 

PRINT exp var = exp 

REM 任何 文本 END 


表达 式 { 按 优先 级 排列 ) : 
加 括号 的 表达 式 ; 
数字 (0 开头 表示 八进制 数 ，0x 开头 表示 十 六 进 制 数 ) ， 变 量 
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第 8 章 
单 上 月 担 作 符 - 


* 1 
ee 

二 <> 

>< 

< 二 >> 工 

* 和 + 也 用 作 布 尔 型 的 AND 和 OR 

布尔 表达 式 把 0 作为 false， 把 1 作为 true 
编辑 : 

行 编辑 器 使 用 每 行事 新 登记 ， 

行 号 后 面 内 容 为 空 表示 删除 该 行 ， 


输入 格式 : 
行内 标记 的 自由 格式 位 置 
行 吉 前 不 允许 有 空格 


为 什么 程序 员 无 法 分 清 万 葵 节 和 和 对 涟 区 


在 OLD 或 SAVE 命令 和 文件 名 之 闻 只 能 正好 是 一 个 空格 


所 有 的 输入 必须 都 是 大 写 的 。 


限制 |: 

行 数 : 1 - 10000 
行 长 : 999 字符 
FOR 谱 套 层 数 : 26 
GOSUB: 999 层 
程序 ; 动态 分 配 
表达 式 : 


错误 检查 /错误 报告 : 
不 执行 任何 错误 检 和 次 


信息 “core dump (信息 转 储 ) ”表示 语法 或 语义 错误 


主机 环境 : 
ANSIC， 传统 的 K&R C 
ASCI 或 EBCDIC 字符 集 


16 位 机 器 为 -32768-32767，32 位 机 器 为 -2147483648-2147483648 


TA VO 0 ee NN nn de er a 
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C 专家 编程 
这 里 提供 的 BASIC 程序 实例 是 一 个 旧 民 的 月 球 登陆 车 游戏 ; 


10 REM Lunar Lander 

20 REM By Diomidis Spinellis 

30 PRINT "You are on the Lunar Lander about to Yeave the spacecraft." 
60 GOSURB 4000 

70 GOSUB 1000 

80 GOSUB 2000 

90 GOSUB 3000 

i100 H=H-V 

ll0OV= ({V+ 6G) * ITIL U*2} /10 
120 F=F-U 

130 TF H > 0 THEN 80 

L135 机 三 

140 GOSUB 2000 

150 IF VY > 5 THEN 200 

160 PRINT "Congratulations! This was a very good landing." 
170 GOSUB 5000 

180 GOSUB 10 

200 PRINT "You have =rashed." 

210 GOTO 170 

1000 REM Initialise 

1010 Ww = 70 


1020 F = 500 
1030 E = 1000 
1040 CG = 2 


1050 RETURN 

2000 REM Frint values 

2010 FRINT "Meter raadings' 

2015 ERINT "—--—----------—--—— . 
2020 FRINT "Fuel (gal}):" 

2030 FRINT F 

2040 GOSUB 2100 + 100 * (H <> 0) 
2050 FRINT V 

2060 FRINT "Height {mn):" 

2070 PRINT H 

2080 RETURN 

2100 PRINT *Landing ‘relocity {m/sec}:" 
2110 RETURN 

2200 PRINT "Velocity {m/sec}):r" 
2210 RETURN 

3000 REM User input 

3005 IF F = 0 THEN 3)70 

3010 PRINT *How much fuel will you use?" 
3020 INPUT U 

3025 IF U < D THEN 3090 

3030 IF U <= F THEN 3060 
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第 8 童 ” 为 什么 程序 员 无 法 分 清 万 圣 节 和 圣诞 节 


3040) PRANT “Sorry, yoi have not got that mvch fuell!" 
3050 GOTO 3010 

3D60 RFETIRN 

30370 U = 0 

3080 RETURN 

3090 PRINT "No chenLing please! Fucl must be := 0." 
3100 GOTO 3010 

4000 REM Detachmen: 

4005 ERINT "Ready ‘or detachment" 

a007 PRINT "™ . COUNTDOWN 3 

4015 FOR I = 1 TY 11 

4D20 PRINT 11 - I 

A4025 GOSUB 4500 

4030 NEXT I 

4035 SRINT "YOU have left the spacecraft." 

4037 PRINT "Try -6 land with velocity less than 5 m/sec," 
4040 RETURN 

4500 REM Delay 

d510 FOR J = 1 TI 300 

A4520 NFEXT J 

4530 RETURN 

S000 FRINT "De yeu want to play again? { 0 = nro, 1 = yeg)， 
5010 INPUT Y 

5b020 IF Y = 0 THEN 5040 

5030 RETURN 

5040 PRINT "Have a nice day." 


如 果 把 这 些 键入 到 - -个 叫做 LANDER.BAS 的 文件 里 ， 就 可 以 在 BASIC 解释 器 里 用 下列 
命令 进行 编译 和 运行 ; 

OL LANDER.BAS 

RU 


BASIC 解释 器 本 身 的 混乱 代码 如 下 : 


#define O{h, f, uv, s, ¢, a) NA\ 

pl) { int o=f(); switch{*p+r+)} {Xu:_ os bl); Xc:_ oab(l); default:p--;_ o;}]} 
#define tf(e,Q, CS)X e:f=fopen{(B+d, });C;fcloset{f) 

#define Ut{y,2Z} whilelp=Q{s,y) *p++=2, *p=° 7 

#define N for (i=0;1i<11*R;i++)m[i]&s 

#define I "g%Q %s\n', 1i, m[i] 

#define XxX ;break;case 

#define _ return 

fdefine R 999 

typedef char*Aa;:int.*C,E[R] ,LIR],MIRI,P[IR] ,l,i,j;char B[RI,F[2];A mf1i2*R], 
malloc{} ,p,q,x,y,2,S,d,f,fopen{(};A Q(ts,o)aA S,0; {for(x=s;*X;x++) {for (y=x, z= 
Dr ZEEYY==*ZPY++) 2++Iif (2>08&I #2)_ xi}_0;}maint) {m{li*Rl="E: ;whilet puts 
("OK"} ,gets(B}})}switch(t*B) (XR':C=E;1=1;for{i=0;i<R;P[i++]=0) ;while(1’ {whil 
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C 专家 编程 
全 
ef!l(s=m. 117)1-+7if lOts, "NM ) {eB# Sd 
while{*=*5) {#6 gritt;iif (jg. C(t" Nb, SI) x+ 一 vB 3S++ 1 -01i13°1) 
l= = eweh(B) {Sb :l=-1X'R :B32] =/M SE Li=*--CIX'I :PE [11-='N' 323EEEGTP=E 
和 [> 2 BTH) )=0,p=nr2,8058(P-G 6， eo 
0,pu-s tbB+o!: (p=Rr5, princf ("sd\r", SI RE ppBId,BiS|-= 08 tt. 1, P++),. 
= RF :WI "0"))=0;pD=B+r5; FP i=B|I3] -Si ;pp-q+ io MI] Si) ;Li|- .XY 
++EFr*d]<-MI*dlse (Ll*d));)else Pp-Et2, PlI*R|-37) ;lr sl NErLiaE (_; XN': 
Nv freetim Lill 3 La 人 WN Srna Le 
‘fgelsiB, Rf} (OB "=0, G0 ED: efaclti o_O; O00 il=a oliB mI i IésT 
oer[ll i; {p=0tB,' "I ?otrecpy (ml ]=ialioclstrlentip}} ,n+.): Im 1] =0,0) ;11085,] 


时 - a 上 Ca [ A YN er 2 , 了 =) 了 t [和 
ee = HOT KE, i >IDIK,Y, ~ 一 ! 了 = [ny, 二 中 六 站 


~ 
1 


Yi (Eo "pe i Serpe ?estriolD, kn,0i: 


+ 
xD== {n+ OS ,Ft CPl*pr+];) 


在 输入 时 注意 子 村 “1” 和 数字 “17” 区 别 ! 如 果 宪 贞 现 在 赋值 符 的 不 边 ， 闭 一 定 起 字母 
过 说 
一 个 难以 演 信 的 程序 ， 很 值得 我 们 川 首 向 .上 程 法 把 它 玉 原 成 三 湿 乱 的 版 森 ， 规 察 它 
ee 如 来 它 激 发 了 你 的 想象 力 ， 你 将 会 很 匣 沈 地 被 告知 你 也 右 能 力 参 加 10CCC 
人 赛 。 只 要 阅读 Usenet 上 的 comp.lang.c 新 闻 组 ， 并 遵循 在 虐 秋 时 候 贴 在 烛 里 的 指示 就 可 以 
参赛 。 注 意 ， 获 胜 者 属 丁 世界 上 最 好 的 程序 员 之 一 ， 但 他 所 |- 的 芭 赴 晤 坏 的 旧 。 


THIS Mr ND A vv see 。 


解决 方案 


RO TE A 
型 | 用 
IJN 


maint) 1 

union 1 
double d; 
float f£:; 


us} 





Ud = 10.0; 
printfi'pat in a dobie, pull out a float f = sf \n", u.f); 


Uf = 0.0: 
printfil" put in a float, pull oul a double d=: $f Va: 
} 


,OUL 
put in a doubie, pil} out a float f = 2.5625C0 
Put in a floatl, PUull ot a couble d -= 524288.200000 
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第 8 章 ”为 从 么 程序 其 无 法 分 清 方 圣 节 和 圣 庶 节 


EE LT rr ve 


解决 方案 


Eee bt EE Ee A TT 


异步 MO 
下 面 的 代码 会 使 基于 SVr4 的 操作 系统 为 每 个 来 自 标准 输入 的 字符 发 送 一 个 中 断 . 


Mime errIno.ns 





#1inC GR <SIqgNdl. 
#1ncluicde «stdio,h: 
nianclude <slLropts.”: 
tinclude <oys/types,.F> 
tinclude <sys/ conf .mn> 


:mi ieration - C&C; 


be 


char CrlLEL - {dxd, Uxa, 0}); 
VOC nandleriintl s) 
inc ~- getchax(); /* 读 入 -个 字符 wy 


rin-fil"gorc char 8e，at count $d %8", ce, :taraticsn, crif}): 


SySsLem’'stty Sane"y).: 
CXit (al; 


[本 和 


maint) 


Sigset (S81GPOLL，handjer); /x* 建立 处 理 程 序 *#/ 
systemiti'"stty raw -echo"); 
icciLlI0，-_STTSIG，S_RDNORMI) ;，/* 请 求 中 断 驱 动 的 答 入 x*/ 


Tor[l;;iteration++}; 
f* 可以 在 这 里 讲 行 一 些 其 他 的 处 理 */ 
} 


使 用 sigset () 而 不 是 signal1()， 就 不 必 在 每 次 都 重新 注册 信号 处 理 程序 ， 下 面 是 输出 
结果 一 例 : 

入 a.Sutl 

got Snar a, at. count 1887525 


got cnar bb, at court 5379648 
got chat c, at Court 7299030 
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C 专家 编程 


got char d, at count 9802103 
got char e, at count 11060214 
got char gq, al. courllL 14551814 





用 FSM 实现 cdecl 


#inc.ude <stdio.h;» 
#inci-ude <string.h> 
#inciude <ctype.h> 


#define MAXTOKENS 7.00 
#define MAXTOKENLEN, 64 


enum type_tag 1 IDENTIFIER, QUALIFIE*, TYPE :; 


struct token f 

char type:; 

char string [MAXTOKENLEN]:; 
上 


int top = -1; 


/* 在 第 一 个 标识 符 (idqentifier) 前 保存 所 有 的 标记 (toker) */ 
struct token stack[MAXTOKENS]}: 
/xy 保存 刚 读 入 的 标记 */ 


struct token this; 


#define pop stack[t2p--] 
#define push{s} stask[++top] = 8s 


enum type_tag 
classify. string (voi'a) 
1* 推断 标识 符 的 类 型 *， 
{ 


char *s = this.string; 
ift{t!listrcmpits, "const"}) { 
strcpy{s, "read-only"); 
Ieturn QUALIF TER; 
} 
ifi!strempls, "volatile'}} return OUALIFIER; 
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itl!lstremp{s, "oid")} return TYPE ; 
ifti!lstrecmp{ts, har"}} return TYPE; 
li(!lstrcmp(s, "signed"}}) return TYPE; 
if(istremp(s, "nsigned")} returr TYPE; 
ifi!cstrcmpts, "short"}}) return TYPE; 
ilifllistrocmp{s, "int")} return TYPE; 
ifli!lstrempls, "iong"})} return 了 YEE， 
if{!strecmp tis, "float'")} return TYPE:; 
if(!strempls, "double'"}}) return TYPE; 
ift!strcmpls, "struct")} return TYPE:; 
if{!streomp (ls, "union"})}) return TYpE; 
if{istrempts, "enum"})) return TYPE; 
returrn JDENTIFIER; 


void gettokenlvoid) 
{ Ar* 读 入 下 一 个 标记 ， 保 存在 “this” 中 */ 


char *p = this.string; 


/1* 略 计 所 有 空白 字符 */ 
whilel (*p = getchar(})) == “ ‘);， 


lf(isalnuml{(*p}' 1 
/* 在 标识 符 中 读 入 4-Z，0-~9 字符 */ 
whnilelisalnuml*++p = getchar:})})},; 
gettokent{}); 


void get. lparen'i) 


1 
nextstate - ge- ptr_partsr 
ifitop >= 0) I 
ffstack[tcp] .type == '{’}) { 
Pop; 
gettoken(}; fj* 从 之 后 读 取 */ 
nextstatie = geL_arYaYy ; 
} 
} 
} 


void get_ptr_ Part  ) 
| 
DeEXtLStaTe = get_type; 
if {stack[top] ,type == '*} 1{ 
printf{'"pcinter to "); 
Pop: 
nextstate = get_lparen; 
yelse iflstack [topl .type -= QUALIFTER) 上 
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站 


nextstaieo - Set_.naren; 


Void gei_type') 
{ 
Nsxtstatce 一 Nuby; 
ft 处 理 在 淡 入 标识 从 之 前 放 在 淮 栈 里 的 所 有 标记 x*/ 
wiilettop >= 0 { 
printti"®s ", pop.string); 
printi{t"\n"}; 


} 


PA TNA 
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全 Try HF i EE Bm OE mt HAA AEN WINTON ot AL PE PA ESE EIST TITRE ON NT A Na 


全 条 





YUDUUEKTRYNYYYYVIVIIAAVUDMDCNAWYNYU NNO A EAN 


绝 不 要 在 妈妈 的 房间 旦 吃 东 西 ， 也 绝 不 要 跟 有 博士 头衔 的 人 玩 牌 。 
并 且 ， 二 万 千 万 ， 鲍 不 要 点 了 C 语 言 在 表达 式 中 把 一 个 类 型 为 下 的 数组 的 左 值 当 作 是 指 
向 该 数组 第 一 个 元 素 的 指针 ， 
—C FAFA Er (fC 


9.1 什么 时 候 数组 与 指针 相同 


第 4 菜 首 重 强调 了 数组 和 指针 并 不 一 艇 的 绝 大 多 数 情形 。 木 章 的 开始 部 分 红 是 讲述 可 
以 把 它们 看 作 是 相同 的 情形 。 在 实际 应 用 中 ， 数 组 利 指针 可 以 三 换 的 情形 要 比 是 者 不 吓 旦 
换 的 情形 更 为 名 见 。 让 我 们 分 别 壮 虑 “启明 ” 利 “ 使 用 ”使 用 它们 传统 的 由 接 含 义 ) 这 两 
种 情况 。 

声 册 木 身 偿 本 以 进 - - 步 分 成 3 种 情况 : 

。 外 部 数组 (exteroal array) 的 声明 。 

* 数组 的 定义 记 件 ， 定 义 是 声明 的 一 种 特殊 情况 ， 知 分 配 内 存 衬 间 ， 并 可 能 提供 一 个 
馆 始 值 ). 

， 归 数 参数 的 声 其 。 

所 有 作为 明 数 参数 的 数组 名 总 是 可 以 道 过 编 详 点 转 换 为 指针 。 在 其 他 所 有 情况 下 《 顾 
有 有 趣 的 情况 跨 是 “在 一 个 文件 中 定义 为 数组 ， 在 另 个 文件 中 记 助 为 指针 ”， 第 4 章 己 有 有 所 
描述 )， 数 组 的 声明 就 是 煞 组， 指针 的 声明 赋 此 指针 ， 关 者 不 能 港 活 。 但 体 使 用 数组 〈 什 语 
全 或 表达 式 中 引用 ) 时 ， 笋 组 总 是 是 以 福成 指针 的 形式 ， 两 者 可 以 生 换 ,图 9-1 对 这 些 情 
况 作 了 总 结 。 
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C 专家 编程 


extern, | extern char a[]; 


不 能 改写 成 指 红 的 形式 











定 狗 ， 如 char a[ 10]: 
不 能 疏 *: 成 指针 的 形式 


吉明 








数组 消 数 的 参数 ， 加 fune(ehar af 


你 可 以 聘 Hi 己 迪 欢 ， 选 择 数 组 形式 
\ 或 音 号 指针 形式 
作 表 达 碟 中 使 用 


ee 训 €=alil: 


你 可 以 隐 自 己 肉 欢 ， 选 择 数 纳 撒 尺 


战 者 是 指针 形式 





图 9-1 什么 时 候 数组 和 指针 相同 


然而 ， 数 组 和 指针 在 编 详 器 处 理 时 是 不 同 的 ， 企 运行 时 的 表示 形式 也 是 不 一 样 的 ， 并 可 
能 产生 不 同 的 代码 。 对 编 旗 器 而 语 ， 一 个 数组 就 起 一 个 址 址 ， 个 指针 就 是 一 个 地 址 的 地 上 引 。 
你 应 该 根据 情况 做 出 选择 。 


9.2 ”为 什么 会 发 生 混 清 


为 什么 人 人 和 们 会 错误 地 认为 数组 和 指针 是 可 以 完全 互 换 的 昵 ?” 这 是 因为 他 们 阅读 了 标准 的 
参考 文献 

The C Programminsg Lansguage， 第 一 版 ，Kernighan & Ritchie， 第 99 页 的 底部 是 : 

As format parameters ir a function definition “作为 溺 数 定义 的 形式 参数 ) ， 

然后 翻 到 第 100 页 ， 紧 接 前 句 : 


char s[]: 
and (和 ) 
char* s; 


are equivalent (是 一 样 的 ;)... 

鸣 呼 ! 真 起 不 垃 ， 这 么 重要 的 -名 话 竞 然 在 K&R 第 二 版 中 被 分 印 在 两 页 上 ! 人 们 在 阅读 
后 一 句 话 时 ,很 容易 坊 掉 它 的 前 面 还 有 … 旬 “作为 函数 定义 的 形式 参数 ”( 也 就 是 说 它 只 限于 
这 种 情况 ), 尤 纵 是 整 句 话 的 重点 在 本 “数组 下 标 表 达 式 总 是 可 以 改写 为 带 偏 移 晤 的 指针 表达 
式 ” 
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第 9 章 真 论 数组 
“C 语言 ”, Ritchie,Johnson,Lesk & Kernighan 在 The Bell System Technical Journal, 第 57 
卷 ， 第 6 号 ，1978 年 ?7.8 月， 第 1991~2019 页 记录 道 ， 
“包含 一 个 通用 规则 ， 就 是 当 一 个 数组 名 出 现在 一 个 表达 式 中 时 ， 它 会 被 转 搁 为 一 个 指 
向 该 数组 第 一 个 元 素 的 指针 。” 
这 个 关键 的 名 如 “表达 式 ” 并 未 在 文献 中 精 傅 定 义 : 
当 人 人 们 竺 习 编 程 时 ， 一 开始 总 是 把 所 有 的 代码 都 放 到 一 个 册 数 里 ， 随 着 水 半 的 进步 ， 他 
和 们 把 代码 分 别 放 到 几 个 渭 数 中 。 在 水 平 继续 提 黄 后 ， 他 们 最 终 学 会 了 如 何 用 几 个 文件 米 构造 
一 个 程 压 。 在 这 个 过 程 中 ,他 们 可 以 看 介 人 量 的 作为 溺 数 参数 的 数组 和 指针 ， 在 这 种 情况 下 ， 
更 者 是 可 以 完全 丘 换 的 ， 如 下 所 未; 


char my_array [12]: 
char *my_ptr; 


PP- ， 


= stxlenimy _ array}); 
= gtyleni{my_pLr); 


a 


程序 员 们 还 可 以 看 肥 许 多 类 似 下 面 的 语句 : 

printfi*%s %s”, zy_ptr, my_array); 

它 清 候 地 上 懂 水 了 数组 和 指针 的 串 鼎 换 性 。 人 们 很 容易 忽视 这 出 是 发 后 在 一 种 特定 的 上 下 
文 环境 中 ， 也 就 是 它们 作为 一 个 函数 调用 的 参数 使 用 。 更 糟 的 是 ， 你 可 以 如 下 编写 : 

PTIRtT (arLTay at localLion %x holds string $c”, a, a): 

件 同 一 条 语 匀 中 ， 既 把 数组 名 作为 一 个 地 址 (指针 )， 又 把 它 作为 一 个 字符 数组 。 这 条 语 
旬 之 所 以 可 行 是 内 为 printf 是 “个 函数 ， 记 以 数组 实际 上 是 作为 指针 来 传递 的 。 我 们 也 习惯 
了 在 main 函数 的 参数 巾 洗 到 char **argy 或 char *argv[] 这 样 的 形式 ， 它 们 也 是 可 以 乒 换 的 。 
同样 , 这 个 之 所 以 成 并 是 因为 argv 站 一 个 因数 的 参数 , 但 它 仍 然 诱 使 程序 员 错 误 地 总 结 出 “C 
语言 在 地 址 运算 方法 上 是 -化 的 和 规则 的 ”。 车 在 脑子 里 己 经 存在 这 样 一 个 概念 ， 自如 上 平时 
常常 可 以 见 到 数组 下 标 表 达 式 被 写成 指针 的 形式 ， 久 而 久之 ， 便 很 容易 把 数组 和 指针 混淆 。 

下 面 这 个 表格 非常 重要 ， 我 会 对 它 进行 解释 ， 它 将 多 次 出 现在 本 章 及 下 一 章 的 内 容 中 。 
请 提起 精神 ， 并 折 个 书 匠 ， 以 后 回 过 头 来 阅读 它 的 次 数 多 着 呢 ! 








什么 时 候 数 组 和 指针 是 相同 的 


C 语言 标准 对 此 作 了 如 下 说 明 : 
规则 1. 表达 式 中 的 数组 名 (与 声明 不 局 ) 被 编译 器 当 作 一 个 指向 该 数组 第 一 个 元 素 的 
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C 专家 编 姓 
指针 ! ( 具体 释义 见 ANSIC 标准 第 6.2.2.1 节 ) 


规则 2. 下 标 总 是 与 指针 的 偏 移 量 相 同 (具体 释义 见 ANSIC 标准 弟 6.3.2.1 节 ) . 


规则 3, 在 函数 参数 的 声明 中 ， 数 组 名 被 编译 器 当 作 指向 该 数组 第 一 个 元 素 的 指针 ( 具 
体 释 叉 见 ANSTC 标准 第 6. 7 节 ) 。 
简 而 言 之 ， 数 组 利 | 指针 了 的 关系 籽 有 点 像 海 机 词 的 关系 ;它们 帮 足 区， Lela -， 帮 不 少 
共同 之 处 ， 们 在 实处 的 表 天 于 法 下 区 各 有 特色 、 上 摧 儿 个 小 节 将 详细 描述 这 上 几 个 规则 的 安 际 


-人 
上 


9.2.1 规则 1; “表达 式 中 的 数组 名 ”就 是 指针 


上 面 的 规则 1 利夫 则 2 合 在 一 起 理解 ， 束 是 对 数 强 下 称 的 引 峡 总 旺 可 以 写成 “一 个 指向 
数 纪 的 起 妨 地 址 的 指针 加 下 颁 殉 最 ” 例如， 假如 臣 们 声 贡 ; 


Lat al 2 


就 可 以 通过 以 任何 种 方法 来 访问 alil 





各 实 上 ， 可 以 采用 的 方法 次 多 。 对 数组 的 引用 如 a 在 编 详 时 总 是 被 编译 器 改写 成 *(ati) 
的 形式 。C 语言 标准 紫 求 编 详 器 必须 其 备 这 个 概念 性 的 行为 . 也许 遵 循 这 个 规划 的 捷 答 就 是 
记 住 方 括号 中 表示 一 个 取 下 标 操作 符 ， 就 像 加 号 表 了 水- :个 加 法 运算 符 : 样 。 取 下 标 操 作答 取 
一 个 整数 和 - :个 指向 类 型 的 指针 ， 所 产 竺 的 结果 类 型 是 T， 一 个 在 表达 式 中 的 数组 名 下 是 
就 成 了 指 外 你 只 要 记 信 ， 在 表达 式 中 ， 指 针 和 数 纪 是 可 义 互 换 的 ， 认 为 它们 在 编译 器 时 人 的 
最 终 形 式 都 是 指针 ， 并 且 痢 可 以 进行 取 下 标 操作 。 斌 像 加 法 一样 ， 到 目标 操作 符 的 可 作 数 是 
可以 变换 的 ( 它 并 不 在 意 摸 作 数 的 先后 顺序 ， 就 像 在 加 法 中 3+5 和 5+3 并 没有 什么 不 一 样 ). 
这 就 是 为 什么 件 个 af10] 共 声明 中 下 而 两 种 形式 都 臣 卡 确 的 : 





” 对 钙 牛 角 尖 的 大 而 语 、 它 搞 实 存在 名 个 模 少 见 的 例外 ， 就 是 把 数组 证 为 -个 丽 你 米 考 看 ， 在 六 细 情 沉 玉 ， 对 数组 的 引 遇 不 能 有 
指向 该 数组 第 -个 光束 的 指名 玉 他 蔡 ， 
” 数 纪 作为 sizeoID 的 名 和 作 数 -显然 业 时 震 更 的 是 整个 烧 纪 的 大 小 ， 册 不 是 指 舒 所 指向 的 第 信 庆 泰 的 大 小 、 
” 性 出 各 操作 符 到 数组 的 地 赴 。 
” 数组 中 “全 字符 串 飞 王 党 字 移 由) 弟 昌 初始 但。 
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第 9 章 再 论 数 经 





在 实际 的 产 棚 代 介 中， 二 面 第 .种 形式 从 来 不 站 使 用 。 确 实 ， 和 除 了 可以 把 新 于 摘 某 之 
外 ， 实 件 没 有 什么 实际 总 义 。 

编译 器 白 动 把 下 标 住 的 沙 长 调整 介 数 组 元 素 的 大 小 。 如 末 整 型 数 的 长 度 是 4 个 学 入， 夫 
么 ali+1H 潭 | alit 在 内 存 中 的 形 离 就 是 4【 而 不 是 1)。 对 是 始 地 址 执行 加 法 操作 之 前 ， 编 洋 副 公 
负责 计算 位 次 增加 的 出 长 。 这 就 起 为 什么 指针 总 是 三 类 蜡 限 利 ， 每 个 指针 只 能 指向 一 种 类 型 
的 原 央 厅 在 一 内 为 编 详 大 沿 要 知道 对 指针 进行 解 除 3 引 用 操作 时 应 该 到 儿 个 季节 以太 伍 个 下 
标的 步 长 应 起 儿 个 人 实 贡 。 


9.2.2 规则 2: C 语言 把 数组 下 标 作为 指针 的 偏 移 晶 


把 数组 下 林 作 为 指针 各 俩 移 昌 是 C 请 计生 BCPL ‘CC 诸 计 的 社 先 》 继 否 过 水 的 技 己 ， 在 : 
大 们 的 常规 加 维 路 ， 在 运行 时 增加 对 C 语 贡 二 标的 范 上 畏 检 查 直 不 切实 际 的 ， 针 为 取 下 栋 操 作 
让 足 赤 页 将 此 访问 该 数组 ， 仁 并 不 你 证 一定 虹 访 间 。 而 给 ， 程 序 员 忆 使 可 以 使 用 指针 米 访 站 
数组 ， 从 而 绕 过 下 标 拉 作 符 ， 在 这 种 情况 上 下， 数组 目标 范围 检测 开 不 能 检测 所 有 对 数组 的 访 
问 芍 情况 。 剖 实 上 二， 上 栋 范 转 检 测 被 认为 并 不 利得 加 入 人 旬 C 请 关中 ， 

述 有 有 -种 说 法 是 ， 在 编写 数组 算法 时 ， 使 月 指针 比 使 用 数 级 “更 杂 效 滨 ” 

这 个 颇 为 大 们 所 接 党 的 说 法 在 通常 情 说 下 是 错误 购 。 和 使 用 起 代 的 产量 质 量 优 张 的 网 详 
澡 ， 一 维 数 弓 利 指针 引用 订 产 后 的 代 委 并 不 具有 好 得 的 天 别 。， 丰 管 怎 样 ， 数 组 个 相 是 定义 
在 指针 的 其 琐 上 的 ， 所 忆 优 化 器 常常 二 以 把 它 转换 为 下 有 有 效率 的 指针 表达 形式 ， 并 后 成桂 
冉 的 笛 器 指令 。 让 我 们 再 丰 一 上 十 数组 /指针 这 琦 种 方 染 ， 并 把 初始 化 从 循环 内 部 的 访问 中 分 
岗 出 来 : 

LInL aa[201，x*p，1， 

变星 a 可 以 用 图 9-2 所 村 的 各 种 方法 来 访问 ， 效 末 完 全 一 样 ， 

旭 徙 编译 内 使 用 的 是 较 原始 的 翻 详 方法 ， 两 潮 普 生 不 一样 的 代 三 ， 用 指针 夺 代 个 一 
维 数 组 常 包 也 并 不 比 玫 接 使 用 下 标 迁 代 一 个 一 维 数组 米 得 史 快 。 不论 起 指针 还 是 数组 ， 在 
连续 的 内 存 地 由 上 上 移动 后 ， 编 泽 右 者 必须 计算 镁 次 前 进 的 步 长 。 计 得 的 方法 是 偏 移 最 乘 以 
-每 个 数组 元 素 盯 用 风 学 他 数 ， 计 算 结 果 就 是 个 移 数组 起 始 地 址 的 实际 字 节 数 。 步 长 央 于 常 
党 是 2 的 乘 方 ( 芭 | int 是 4 个 字 节 ，double 是 8 个 学 节 等 )， 这 样 编译 器 在 计算 时 残 可 以 使 
用 快速 的 左 移 位 运算 ,而 不 是 相对 绥 慢 的 加 法 运算 .- 一 个 : 进 和 制 煞 左 移 3 位 相当 十 它 乘 以 8: 
如 果 数 组 中 的 元 素 的 大 小 不 是 2 的 乘 方 ( 旭 数组 的 匹 索 类 型 十 一 个 结构 )， 那 就 不 能 使 用 这 
个 技巧 了 。 

然而 ， 迁 代 一 个 int 数组 是 人 们 最 容易 想到 的 。 如 果 : 一 个 经 过 及 好 优化 的 编 详 器 进行 代 
公分 析 ， 并 把 基本 变种 放 在 站 速 的 寄存 嵌 中 来 确认 循环 是否 继续 ， 那 么 最 终 在 循环 中 访问 指 
针 和 数组 所 产生 的 代码 很 可 能 是 相同 的 。 

仁 处 理 一 维 数组 时 ， 指 针 上 不 见得 比 数 组 史 快 。C 语言 把 数 引 下 标 疏 写成 指针 偏 移 量 的 
根本 麻 因 是 指针 和 偏 物 量 是 底层 馈 件 所 使 用 的 基本 模型 。 
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指针 备 选 方案 1 


forti = 0; :. < 0; ir+} 





指针 备 选 方案 2 











中 间 代 码 


把 弄 值 a2 装 入 R15 可 以 提 到 秆 环 外 ) 
把 要 值 fi) 装 入 R2 可 以 提 到 循环 处 ) 
把 [R2] 装 入 R3 


刻 果 笛 鉴 ,对 R3 的 步 长 述 行 测 整 把 R1+R3 
的 结 琳 装 入 RR4 中 
把 0 存储 型 [R41。 












把 蛮 值 (pi 装 入 RO 《可 以 提 到 循环 外 ) 
把 !RO4 灶 入 &1【〈 可 以 提 色 循环 外 ) 
”把 左 值 〈i) 装 入 R2 【可 以 提 到 循环 外 ) 
把 [R2j 鞭 入 RS 
贡 果 让 要 ， 对 R3 的 步 长 进行 调整 
把 RI+R3 的 结果 装 入 R4 由 
把 0 存储 到 [Rd41. 


与 指针 备 选 方案 ] 相同 
想 - 想 ， 为 什么 ?， 


把 p 所 指 太 象 的 大 小 装 入 R5 
(可 以 提 守 循 奈 外 ) 


把 左 值 (p) 装 入 RI【 可 以 提 到 循环 外 》 
把 [RO] 装 入 RR1] 

把 0 存储 到 [R1] 

把 R5+R1 的 结果 装 入 RI1 

把 Rl 齐备 天 IR0] 


上 上 面 这 些 例子 显示 了 不同 的 备 选 方案 络 过 翻 详 后 所 产生 的 中 间 代 码 。 如 果 采 用 优化 措施 ， 中 间 代 码 
可 能 跟 这 里 显示 的 不 样 ，R0、R1 等 代表 CPU 的 寄存 器 。 在 网 9-2 中 ， 我 们 用 


R0 仓储 p 的 左 值 
R2 存储 i 的 不 值 


R1 存 鱼 aa 的 堪 值 哎 p 的 机 值 
R3 存储 i 的 而 划 


[R9] 表示 间接 戟 入 或 地 入 , 其 地 址 就 是 穿 存 器 的 内 容 《 这 是 许多 访 纲 瓷土 所 全 用 的 “个 普通 概念 ) 。 
“可 以 提 到 循环 外 ”表示 这 个 数据 不 会 被 循环 收 改 ， 在 每 次 短 环 时 可 不 必 执 行 该 语 名 ， 可 以 加 快 循环 的 


速度 ， 


图 92 数组 /指针 的 中 间 代 码 比 较 
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9.2.3 “作为 函数 参数 的 数组 名 ”等 同 于 指针 


规则 3 也 需要 进行 解释 。 首 先 ， 让 我 们 回顾 一 下 The C Programming Languase 中 所 提 汉 
的 一 些 术语 。 
术语 定 义 例 十 
形 参 (parameter)  。 它 是 一 个 变 贡 , 在 消 数 定义 或 明 数 声明 的 jnt Powerfint base, int D); 
原型 中 定 闵 。 闵 称 “ 形 式 参 数 《formmal base 和 mn 都 古 形 参 
parameter)” 
实 参 (argument) 在 实际 调 片 个 函数 时 所 传递 给 滑 数 的 ”i= power(10, j); 
值 ， 叉 称 “ 实 际 参 数 (actmal paramenter)” ”10 和 j 邮 是 实 参 .在 寺 一 个 国 数 的 多 次 调用 
时 ， 实 参 可 以 不 国 


标准 规定 作为 “类 型 的 数组 ”的 形 参 的 声明 应 该 调整 为 “类 型 的 指针 ”。 齐 需 数 形 参 定义 
这 个 特殊 情况 下 ， 编 译 器 必须 把 数组 形式 改写 成 指向 数组 第 -一 个 元 素 的 指针 形式 。 编 详 器 内 
问 消 数 传递 数组 的 地 址 ， 市 不 是 整个 数组 的 找 贝 。 不 过 ， 埠 在 让 我 们 重点 观察 -上 数组 ， 降 
性 转换 意 昧 着 二 种 形式 是 完全 等 问 的 。 因 此 ， 在 my_function 人 的 调用 上 ， 无 论 实 参 是 数组 还 
是 真 的 指针 都 是 合法 的 。 

my_functiontiint *turn:p) { 


my_functicontint turnip:l1) {7 
My¥_functiont{tint tumipi200]) { ... } 


9.3 为 什么 C 语言 把 数组 形 参 当 作 指针 


之 所 以 要 把 传递 给 函 煞 的 数组 参数 转换 为 指针 是 出 于 效率 的 考虑 ， 这 个 理由 常常 也 是 对 
违反 软件 工程 做 法 的 辩解 。Fortran 的 IO 模型 使 用 起 来 相当 条 烦 ， 因 为 它 必须 “有 效 地 ” 复 
用 现 有 的 IBM 704 汇编 程序 YO 库 〈 尽 管 相当 笨拙 ， 而 用 已 经 过 时 )。 全 面 的 语义 检查 被 可 移 
植 的 C 编译 器 所 排斥 ， 其 理由 很 牵强 ， 他 们 认为 把 lint 程序 作为 一 个 单独 的 程序 , “效率 ”会 
更 高 一 些 。 大 多 数 现 代 的 ANSI C 编译 器 在 错误 检查 方 和 都 作 了 增强 ， 也 算是 对 这 个 决定 的 
不 认同 吧 。 

把 作为 形 参 的 数组 和 指针 等 同 起 来 龙 出 于 效 举 原因 的 考虑 。 在 C 语言 中 ， 所 有 非 数 组 形 
式 的 数据 实 参 均 以 传 值 形 翅 《对 实 参 作 一 份 拷贝 并 传递 给 调用 的 清 数 ， 隐 数 不 能 懂 改 作为 实 
参 的 实际 变量 的 值 ， 而 只 能 修 改 传递 给 它 的 那 份 拷贝 ) 调用 。 然 而 ， 如 果 要 拷贝 整个 数组 ， 
无 论 在 时 间 上 还是 在 内 存 罕 间 上 的 开销 都 可 能 荐 非常 大 的 。 而 且 在 绝 大 部 分 情况 下 ， 你 其 实 
并 不 骨 要 整个 数组 的 拷贝 ， 你 只 想 告 诉 函 数 在 那 一 时 刻 对 哪个 特定 的 数组 感 兴 趣 。 要 达到 这 
个 目的 ， 可 以 考虑 的 方法 起 在 形 参 上 增加 一 个 存储 说 明 符 (storage specifier)， 上 表示 它 基 传 值 调 
用 还 是 传 址 调用 ，Pascal 语言 就 是 这 样 做 的 。 如 果 采 用 “所 有 的 数组 亦 作为 参数 传递 时 都 转 
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换 为 指 包 数组 起 纵 地 下: 的 指针 ,而 基 他 的 参数 均 采 用 传人 调用 ”的 约定 ， 吴 避 以 前 化 强 详 器 
炎 似 地 ， 轩 数 的 巡回 梢 绝 不 能 是 “个 闲 数 数组 ， 而 闪 能 其 指向 数 纠 或 昂 数 的 指针 

有 些 人 估计 次 把 已 坏 解 或 除数 朋 有 [也 数 之 外 鸭 古 有 的 C 语 言 人 参数 在 缺 省 情 沈 下 部 是 传 值 湖 
骨 ， 数 组 和 闭 数 则 是 传 址 调用 。 数 据 起 可 以 使 用 传 直 调用， 只 昌 村 和 它 前 面 品 二 专 地 十 操作 符 
( 作 )， 这 梓 传 递 给 郧 数 的 证 委 奢 的 邮 十 而 不 是 实 参 的 拷贝 ， 吾 实 上 上 上， 到 地 证 操作 符 的 主要 出 途 
吕 是 实现 传 址 调用 :全 址 调用 ”这 个 说 法 从 严格 瘟 广 说 许 不 二 分 淮 笠 ， 拓 为 编 详 器 的 机 全 
非 疝 消 楚 在 被 调 川 的 闫 数 中 ， 你 只 拥有 个 指向 变量 的 指针 而 不 古 灾 全 本 二 :如果 你 地 
灾 参 的 地 址 或 对 它 进 行 斤 贝 ， 狂 能 体会 钊 时 前 的 范 知 ， 


数组 形 参 是 如 何 被 引 必 的 
图 9-3 展示 了 对 个 下 标 形 式 的 数组 上 形 参 进行 访问 所 于 要 的 儿 个 步 结 。 


:teiehar rl.:;} 
TY “Ee! ee ei 
编 详 足 符号 胡 旺 未 pp 汪 这 联 十， 从 堆 校 指针 SP 偏 梯 414 个 信和 时 
座 行 叫 步 距 1: 从 SP 贫 移 14 个 售 贤 线 到 国 数 的 洛 冰 沁 江 ， 求 出 实 珍 ， 
运 生 时 小 晤 2: 家 主 的 傅 ， 并 5 5081 相 风 |. 
这 行 时 此 中 3 取出 趣 填 6508L+Hi3fFT 内 雁 . 


一 人 人 人” ”人 
号 上 经 过 Ask 
5 | | 
SP-]4 5081 +1 +2 43 要 .天 


图 9-3 下 标 形 式 的 数组 形 佑 基 如 何 引用 的 


注 闽 它 和 第 4 章 图 C - 样 , 图 C 显示 的 是 “个 下 标 形 式 的 指针 是 如 何 但 找 地 址 的 。C 诸 
呈 允 许 程序 员 把 形 参 声明 为 数组 (程序 员 打算 传递 给 消 数 的 东 贞 或 者 指针 (质数 实际 所 接 
收 证 的 东西 )。 编译 涡 知 道 何 时 懂 参 是 作为 数组 让 明 的 , 但 事实 上 在 函数 内 部 ， 编 详 器 始终 把 
它 当 作 个 指 六 数组 第 “个 元 素 〈 疱 素 长 度 示 知 》 的 指针 ， 这 样 ， 编 译 器 可 以 产生 正确 的 代 
多， 并 不 辣 要 对 数组 和 指针 这 此 种 情况 作 仔 细 |X 分 。 

不 管 程序 员 实 际 所 写 的 是 哪 种 形式 , 闲 数 并 不 自动 知道 指针 所 指 的 数组 共 右 多 少 个 元 素 ， 
所 以 必须 要 有 个 约定 ， 如 数 弓 以 NUL 结尾 或 者 另 有 一 个 附加 的 参数 农 示 数组 的 范围 。 六 然 
并 个 站 每 种 说 吉 都 起 这 样 依 的 ， 比 如 Ada， 它 的 冬 个 数组 邦 有 一 些 附加 信息 ， 表 示 得 个 元 素 
的 长 度 、 数 组 的 维 数 以 及 下 标 范 轩 。 

在 下 列 定义 中 : 


funetint EunBy 人 os .4 
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Eunc{int turnip[ (tt ... } 


functint turnipl2051{ ... } 


ins Ty ints f* 数据 定义 *j 
inc *my_inL_ptr:; 
JIDnL wy_irnt_ array[-0]:; 


你 可 以 合法 地 使 用 下 列 任何 一 个 实 参 来 调用 上 面 任 何 “个 原型 的 少数， 它们 常常 用 于 不 
同 的 日 的 : 
表 9-1 数组 /指针 实 参 的 一 般 用 法 
调用 时 的 实 参 


funclgmy _int}):; 





通常 有 的 
一 个 it 参数 的 传 直 调 用 
传递 - -个 指针 
传递 -个 数组 


传递 数组 的 “部 分 






一 个 整 型 数 的 地 址 
指 同 整 型 数 的 指针 


func tmy_int array}; | 整 型 数组 
func{i&my_int_array[:1); | 一 个 整 型 数组 某 个 并 素 的 地 址 


相反 ， 如 果 处 于 func() 孙 数 内 部 ， 就 没有 一 种 容声 的 方法 分 辨 这 些 不 问 的 实 参 ， 因 此 也 
无 法 知道 调用 该 函数 是 出 于 何 种 目的 。 所 有 属于 少数 实 参 的 数 纪 在 编译 时 被 纺 详 髓 改写 为 指 
针 。 因 此 ， 在 函数 内 部 对 数组 参数 的 任何 引用 都 将 产 牛 一 个 对 指针 的 引用 。 网 9-3 显示 了 它 
的 实际 操作 过 程 。 

因此 ， 很 有 意思 的 是 ， 没 有 办 法 把 数组 本 身 传 递 给 :个 前 数 ， 因 为 它 总 是 被 昌 动 转换 为 
指向 数组 的 指针 。 当 然 ， 在 孙 数 内 部 使 用 指针 ， 所 能 述 行 的 对 数组 的 操作 几乎 跟 传递 诛 原 本 
本 的 数组 没有 差别 。 只 不 过 ， 如 果 想 用 sizeof( 实 参 ) 来 获得 数组 的 长 度 ， 所 得 到 的 结果 厅 
正确 而 已。 

这 样 ， 在 声明 这 样 一 个 通 数 时 ， 你 就 有 了 选择 余地 。 可 以 把 形 参 定义 成 数组 ， 也 本 以 定 
义 成 指针 。 不 论 你 选择 什么 ， 编 译 器 都 会 注意 到 该 对 象 是 一 个 函数 参数 的 特殊 情况 ， 它 会 产 
生 代码 对 该 指针 进行 解除 引用 操作 。 







Euamc tny_ int_Dtr)， 









编程 挑战 








玩 转 数 组 /指针 实 参 
编写 并 执行 一 个 程序 ， 验 证 前 面 的 说 法 ， 
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1. 定义 一 个 沸 数 ， 它 接 党 一 个 字符 数组 参数 ta。 在 函数 内 部 ， 打 印 出 廊 ca、 帮 (caf0] 和 


&t{ca[1]) 的 值 ， 
2、 另 外 定义 一 个 函数 , 它 接 受 一 个 字符 指针 参数 pa, 在 测 数 内 部 , 扩印 出 &&pa, 攻 (pa[0])、 
及 (pa[1D 和 ++pa 的 值 ， 


3. 建立 一 个 全 局 字符 数组 ga 并 用 英文 字母 初始 化 . 调用 两 个 使 用 空 作为 和 参数 的 函数 ， 
比较 两 个 通 数 所 打印 的 值 ， 

4. 在 main 程序 中 打 第 出 有 &ga，&&(ga[0]} 和 履 (gal1]) 的 值 . 

5, 在 运行 程序 之 前 ， 先 写 下 预计 打印 出 的 值 ， 并 说 明 为 什么 。 如 果 预 期 值 和 程序 实际 打 
印 的 值 有 出 入 ， 解 释 其 中 的 原因 。 








Ai 


如 来 尔 想 让 代码 在 上 去 消 楚 明 白 ， 就 必须 遵循 一 定 的 规则 ! 我 们 倾向 于 始终 把 参数 定义 
为 指针 ， 因 为 这 是 编译 器 大 部 所 使 用 的 形式 。 如 果 名 不 天 实 ,， 那 就 是 :种 很 可 疑 的 编程 风格 。 
但 从 用 一 方 咖 看 ， 有 些 人 宽 得 int table[] 比 int *table 更 能 表达 程序 员 的 意图 。table[] 这 种 记 法 
清楚 地 表明 了 table 内 里 有 好 几 个 元 素 ， 提 小 函数 会 对 它们 都 进行 处 理 。 

注 户 ， 有 有 一 样 操作 只 能 在 指针 里 进行 而 无 法 在 数组 中 进行 ， 那 就 是 修改 它 的 值 。 数 组 名 
是 不 可 修改 的 左 值 ， 它 的 值 直 不 能 改变 的 。 见 图 9-4《 几 个 冰 数 并 排放 在 -起 以 便 比较 ， 它 
们 都 是 同一 个 文件 的 一 部 分 )。 


指针 实 参 数组 实 参 非 实 参 的 指针 


EJ {int *plL.r) tun2itint azrtf[]) int array lilo60!l ,arrcray?l100):; 
{ { mainl} 

Bt}. c= 3 arril] = 3: ! 

PE = 3; *arr = 3; arrav 1] = 3; 


Pt = arrdy2; arr = drrdy2s *array = 3; 


array = array?; /+* 失 败 *! 
} 





盘 9-4 数组 实 参 的 有 有效 操作 


诗句 array = array2; 将 引起 一 个 编译 时 错误 ， 错 误 信 息 芋 “无 法 修改 数组 名 ” 但 古 ，arr = 
array2 却 是 合法 的 ， 内 为 an: 虽然 声明 为 -个 数组 但 实际 上 却 是 一 个 指针 。 


9.4 数组 片段 的 下 标 

可 以 通过 向 访 数 传递 个 指向 数组 第 一 个 元 素 的 指针 来 访问 整个 数组 ， 但 也 计 以 让 指针 
指向 任何 一 个 元 素 , 这 样 传递 给 函数 的 就 是 从 该 元 素 之 后 的 数组 片段 。 有 些 人 (主要 是 Fortran 
程序 员 ) 用 另 一 种 方法 扩展 这 种 技巧 。 他 们 向 函数 传递 数组 前 面 一 个 位 置 的 地 址 (af-1])， 这 


208 


第 9 章 再 论 数 纪 
杜 谍 对 以 使 数 纪 的 下 标 内 和 到 N， 市 不 是 从 0 他 N-1。 

a ed We lee em 个 
技巧 对 你 可 能 很 有 吸引 力 。 不 率 和 多 是， 这 ed “标准 第 6.3.6 节 ,“ 附 加 
ae ee ， 而 用 这 个 做 法 确实 被 特别 地 标注 为 可 能 引起 林 
害 义 的 行为 ， 所 专 你 干 万 个 要 告诉 别人 十 ee 

要 取得 Fortran 程序 识 知 波 的 效果 其 实 非 常 简单 :只 要 在 数 组 的 下 明 中 广 它 的 长 度 比 所 稿 
on 这 样 数 组 的 下 标 范 轩 战 是 0 到 N， 然 后 只 使 有 1 到 NN 束 行 了 。 不必 锋 上 成 ， 不 必 惊 

， 谍 是 这 文公 简单 。 


9.5 数组 和 指针 可 交换 性 的 总 结 


警 和 全: 在 你 阅读 并 副 解 前 面 的 章节 之 前 不 要 阅读 这 一 节 的 内 容 ， 售 为 它 可 能 会 使 你 八 和 脑 
力 永 和 久 退 化 ， 

i. 用 a0il] 这 样 的 形式 对 数组 进行 访问 总 是 被 编译 器 “改革 ”或 解 伴 为 像 %a+l) 这 样 的 指 
针 访 问 : 

2. 指针 始终 就 赴 指 针 。 它 绝 不 可 以 改写 成 数组 ,你 吓 以 用 目标 烧 式 访问 指 外， 一 般 郁 是 
指针 作为 区 数 参数 村， 而且 你 知道 实际 传递 给 银 数 的 是 :个 数组 ， 

3. 在 特定 的 上 下 文中 ， 也 就 是 它 作为 浮 数 的 参数 也 具有 这 种 情况 )，- -个 数组 的 声明 
可 以 看 作 是 一 个 指针 。 作 为 消 数 参数 的 数组 《就 是 在 -个 也 数 调 虽 中 ) 始终 会 被 编译 器 修改 
成 为 指 同 数 弓 第 一 个 元 素 的 指针 。 

4. 因此 ， 当 把 - 个 数组 定义 为 请 数 的 参数 时 ， 人 
针 。 不 答 选 择 哪 种 方法 ， 在 表 数 内 部 事实 上 获得 的 都 是 一 个 指 凶 

5. 在 其 他 所 有 情况 中 ， 定 义 和 声 明 必 须 匹 配 。 emg 个 数组 ， 在 其 他 文件 对 它 进 
行 声 遇 时 也 必须 把 和 多 声明 为 数组 ， 指 针 也 是 如 此 。 


9.6 CC 语言 的 多 维 数组 


有 些 人 声称 C 衣 志 没有 多 维 数组 ， 这 是 不 对 的 。ANSTE C 标准 在 第 6.5.4.2 节 以 及 第 69 
号 脚注 上 表示 : 
当 几 个 “中 ”修饰 符 和 连续 出 现时 ( 方 括号 里 面 是 数组 的 范围 )、 就 是 定义 一 个 多 维 数 组 ， 


9.6.1 但 所 有 其 他 语言 都 把 这 称 为 “数组 的 数组 ” 


那些 人 的 意思 是 C 语言 没有 像 其 他 诸 言 - - 样 的 多 维 数组 ， 如 Pascal 或 Ada。 在 Ada 中 ， 
可 以 如 图 9-5 那样 占 明 -- 个 多 维 煞 组。 
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-> 了 
C 专家 编程 
apPPEiISS :arayiu. 10，-..80 cc real; 


或 者 册 明 “个 数组 的 数 织 ， Ada 
Ly¥BPG vecto:; -8S array(1..921 of real; 


IAN STravice lo of Mem 


图 9-5 Ada 的 例 了 


但 是 个 把 革 厅 和 到 混为一谈 , 让 Ada 中 , 多 维 数组 和 数组 的 数组 是 两 个 完全 相同 的 概念 。 
Pascal 则 本 用 了 一 种 下 反 的 万 法 。 在 Pascal 中 ， 数 纪 的 数组 和 多 维 数 绀 站 可 以 完全 手 换 
的 ,并且 在 任何 时 候 帮 是 等 同 的 。 丰 : Pascal 中 ， 可 以 像 图 9-6 则 样 声 明和 访问 一 个 多 维 数 细 


war M ; drray -ji of aryayr el of char; 


NIi}[j: := t; 
习 纲 上 人 们 腔 几 方 佳 的 简写 形式 : Pascal 
Var Ys arriy DG Er ehar; 
Ml. Tx es 





图 9-6 ”Pascal 的 例子 


The Pascal User Manual and Report 清楚 地 说 明了 数组 的 数组 与 多 维 数 组 是 等 同 的， 两 疹 
可 以 五 换 。Ada 语言 企 这 力 面 的 限制 更 紧 一 些 ， 它 严格 地 维持 了 数组 的 数组 和 多 维 数 组 之 间 
的 区 别 。 在 内 存 中 它们 看 上 去 戌 .- 样 的 ， 亿 在 哪个 类 型 共有 兼容 性 以 及 可 以 被 赋值 给 -个 数 
组 的 数组 的 单独 的 行 的 问题 上， 两 者 存在 明显 的 甘 别 。 这 有 点 像 在 int 和 float 之 问 选 择 变量 
的 类 型 : 所 选 搓 的 类 型 最 大 用 度 地 反映 了 底层 的 数据 。 在 Ada 中 ， 当 具有 独立 可 变 的 下 标 时 
如 用 和 卡尔 华 标 确定 茶 一 点 的 位 疹 ， 一 般 会 选择 多 维 数组 。 当 数据 在 层次 上 更 加 鲜明 时 ， 如 
不 个 数组 具有 [12] 月 [51 周 [7] 日 这 样 的 形式 来 代 袁 某 事 物 的 体 日 记录 ， 们 右 时 也 需要 同时 抬 级 

整个 星期 或 月 时 ， - 艇 选择 数组 的 数组 。 








、 小 启发 





在 不 同 的 语言 中 ，“ 多 维 数组 ”的 含义 各 有 什么 不 同 


Ada 语言 标准 明确 说 明 数 组 的 数组 和 多 维 数组 是 不 一 样 的 。 
Pascal 语言 标准 明确 说 明 数 组 的 数组 和 多 维 数 组 是 一 样 的 ， 


Ye Pascal User Manual und Report, Spring-Yerlag, 1975， 第 39 页。 
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第 9 章 再 论 数组 
C 语言 里 面 只 “有 一 种 别 的 语言 称 为 数组 的 数组 的 形式 ， 但 语言 称 它 它 为 多 维 数组 ， 


CTE 
a et mr nd 


C 证 芋 的 方法 多 少 有 点 独特 ， 定义 和 引用 多 维 数组 惟 Wai 尽 
答 C 诸 世 把 数组 的 数组 当 作 是 多 纵 数 组 , 但 不 能 把 此 个 下 标 范 畏 如 国 Hjjtkj 合 并 成 Paseal 式 的 
F 标 表达 式 风格 如 [ij,k|， 如 果 你 清楚 地 明白 白 己 在 做 什么 ， 也 介意 产 0 钢 范 的 程序 ， 可 
以 把 和 Dj][K] 这 样 的 下 标 值 计算 为 相应 的 偏 移 虽 ， 然 证 只 曙 个 单 的 下 标 [z] 来 中川 数组 ， 当 
然 这 不 是 -种 值得 推 存 的 做 法 。 回 样 糖 料 的 是 ， 像 六 j, kK 这 样 的 下 标 撒 式 由 过 号 分 隔 ) 是 
C 诸 言 合法 的 表达 形式 ， 只 是 它 并 非 同时 引用 这 几 个 下 标 《 它 实际 证 所 引用 的 上 下 标 值 是 k， 
也 是 右 过 号 表达 式 的 值 ): C 洁 兰 支持 其 他 语言 一 般 称 作 “ 数 组 的 数 纪 ”的 东 上 是， 位 却 称 它 为 
多 维 数组 ， 这 样 就 模糊 了 两 者 的 边界 ， 售 许多 人 尘 两 者 混淆 不 清 ，( 见 网 9-7) 





在 CC 诸 言 中 ,而 以 象 下 面 这 样 卢 明 个 10X20 的 多 维 字符 数组 : 
char carrot| LO0][20]; 

或 者 声明 一 种 百 上 闪现 你“ 数组 的 数组 ”形式 ; 
typedef char vcbetablel20]， 
VCgetable carrot[10]; 

不 论 哪 种 情况 ， 沪 癌 单 个 字符 部 吓 遂 过 carrot[i]] 的 形式 ， 

编译 器 在 编 详 时 会 反 它 解析 为 %(carrot+ D+j) 的 撒 式 ， 


图 9-7 数组 的 数组 


管 术语 上 称 作 “多 准 数组 ”但 C 语言 实际 上 只 支持 “ 数 纽 的 数 给 ” 如 果 人 在 你 的 叫 维 
ee 把 数 弓 看 作 是 “ 圳 向 量 〔 即 基 种 对 象 的 一 维 数 组 ， 它 的 元 素 末 以 古 另 一 个 数组 )， 就 
能 极 大 简化 编程 语言 中 这 个 相 汉 复 杂 的 领域 。 


i DEE 二/ 针 iy 机 六 林 机 本 机 9 林村 村 本 本 打 和 Good 亲 Wiwcarycceiereim 本 只 Pop m 本 条 打 打 机 亲 厅 本 才 时 林业 和 有 ps -iewwwpww we mr araere 





C 语言 中 的 数组 就 是 一 维 数组 


当 提 到 C 语言 中 的 数组 时 , 就 把 它 看 作 是 一 种 向 量 (vector), 也 就 是 某 种 对 象 的 一 维 数组 ， 
数组 的 元 素 可 以 是 另 一 个 数组 、 


PP 


9.6.2 ”如 何 分 解 多 维 数 组 
必须 仔细 注意 多 维 数 组 是 如 何 分 解 为 几 个 单独 的 数组 的 ,如 果 我 们 声明 如 下 的 多 维 数组 ; 
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int apricaol I2, 13|] [21; 


于 以 按 洛 9-8 所 示 的 任何 -- 种 方法 为 它 伯 内存 中 是 位 ; 


Ra aEricob .21 3 15 


慕容 类 于 sizecdt { a pe ) 
apricoL al 


int i*p} [3][S] a 


sizeatt apticatli] 》 


a apricoll] | 


be 2 GDLLCOL i 


sj7eoff apricot i| (| } 


apricot | apricot[OJ[0] | apncot[O][1 | aprcotloj[21 | aprcotUlllo]l | apricoti] ll2] apricot[il[2| 


inL *L = apricoL Li! 





sizeott apmcot [1] [IKI } 


i 


In L :+ ApricoLlL .i 
图 9-8 多 维 数组 的 存 钞 


于 常 捕 况 下 ， 购 位 发 生 在 两 个 相同 的 类 型 之 间 ， 如 int 与 int、doubie 与 double 等 。 在 图 
9.8 中 ， 届 以 看 到 在 “数组 的 数组 的 数组 ”中 的 每 一 个 单独 的 数 织 都 可 以 看 作 居 个 指 外， 
这 丰 因 为 在 表达 式 中 的 数组 名 被 编译 器 当 作 “指向 数组 第 一 个 元 素 的 指针 ”( 第 242 页 的 规则 
1)。 换 多 话说， 本 能 把 一 个 数组 赋值 给 另 一 个 数组 ， 因 为 数组 作为 一 个 整体 不 能 成 为 赋 伦 的 
对 象 。 可 以 把 数组 名 赋值 给 … 个 指针 ， 就 是 因为 这 个 “在 表达 式 中 的 数 纪 名 被 编 滩 器 当 作 一 
个 指针 ”的 规则 。 
指针 所 指向 的 数组 的 维 数 不 同 ， 其 区 别 会 很 大 。 使 用 上 面 例 季 中 的 声明 : 


r++; 


Gs 


将 会 使 r+ 和 t 分别 指 向 它们 各 自 的 下 一 个 元 素 (两 者 所 指 问 的 元 素 本 寺 部 是 数组 )。 它 们 所 增 
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一 一 一 一 一 一 一 一 一 


长 的 步 长 是 很 不 相同 的 ， 因 为 上 所 指向 的 数组 元 素 的 人 小 是 + 所 指 回 的 数组 的 元 泰 大 小 的 二 





使 用 下 面 的 声明 : 


Int apricot [2]113T 2 5] 


:nr (fxr)[5] = apricot[0]: 
iat *t .= apricotld.[0l 


编写 一 个 程序 ， 打 印 旦 [和 ft 的 十 六 进 制 初始 值 (使 用 printf 的 %x 转换 符 ， 打 印 十 六 进 
制 值 ) ， 对 这 两 个 指针 进行 自 增 (++) 操 作 ， 并 打印 它们 的 新 值 ， 
在 运行 程序 之 前 ， 预 测 一 下 指针 每 次 增长 的 步 长 是 多 少 字 节 ， 可 套 考 图 9-8. 


9.6.3 ”内 存 中 数组 是 如 何 布 局 的 


在 C 语 霹 的 多 维 数 丝 中 ， 最 右边 的 下 标 古 最 先 灾 化 的 ， 这 个 约定 被 称 为 “ 行 主 序 ”。 由 
于 “ 行 / 列 主 序 ” 这 个 术语 上 只 适 用 于 恰好 是 一 维 的 多 维 数组 ， 所 以 更 确切 的 术语 是 “最 布 的 下 
标 先 变化 ”… 绝 大 部 分 语言 都 采用 了 这 个 约定 , 但 Fortran 却 是 … 个 主要 的 例外 , 它 采 用 了 “最 
左 的 下 标 先 变 化 ”， 也 三 是 “ 列 主 序 ”。 人 在 不 同 的 卜 标 变化 约定 中 ， 多 维 数组 在 内 存 中 的 布局 
也 不 相同 。 事 实 上 ， 如 果 池 一 个 C 语言 的 矩阵 传递 给 个 Fortran 程序 ， 朱 阵 就 会 被 自动 转 
首 一 一 这 是 一 个 非常 历 岩 的 邪门 密 技 ， 偶 尔 真 还 会 用 到 。 


最 低 出 址 着 一 一 一 一 一 一 一 一 入 ”最 锅 比 址 


C intalzll3] afol[0] ao a[0][2] a11]10] a0 afl][2] ”最 省 的 下 标 先 变化 
Fortran dim a(2,3) atl,l)y al2.]) afl2) af22) a(l,3) al2.3) 最 充 的 下 标 先 改 化 


图 9-9 行 主 序 vs, 列 主 序 


C 语 主 中 多 维 数 组 最 人 的 用 途 是 存储 多 个 字符 申 。 有 人 指出 “最 右边 的 下 标 先 变 化 ”在 
这 方面 共有 优势 (每 个 字符 串 中 相 邻 的 宁 符 在 内 存 中 也 相 邻 存储 ), 位 在 “最 左边 的 下 标 先 变 
化 ”的 多 维 数 组 〈 如 Fortran) 中， 情况 并 不 如 此 。 
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39.6.4 如 何 对 数组 进行 初始 化 


在 最 简单 的 情况 下 ，“ 维 数组 可 以 通过 把 初始 值 部 放 在 一 对 花 括 号 内 来 完成 初始 化 。 刀 
及 在 数组 的 定义 里 未 标 遇 它 的 长 度 ，C 语 主 约定 按照 初始 化 值 的 个 数 米 确定 数组 的 长 度 ， 

float. banana[ls] 2 { O00 2Z.0 2.72, 3.14; 25.625 和 

fioat noreyanwi] = { 0.0, 1,.0, 2.72, 3.14, 25.625 }; 

只 能 够 得 数组 点 明 时 对 和 它 进 行 整体 的 初始 化 。 之 所 以 存在 这 个 限制 , 并 没 得 过 硒 的 班 由 。 

多 维 数组 可 以 通过 赔 套 的 花 括 号 进行 初始 化 : 


Short Cantaleunpe[2 [5 = 1 
10, la 3 Ad 587, 
1 BD Oi 0 0}, 
he 
int rhunarbi1l[l3; < € 0, 0, 0}, 1], 1, 1}, }; 
注意 ， 可 以 在 坡 后 一 个 初始 化 值 的 后 面 加 -个 过 号 ， 也 可 以 省 略 它 。 问 时， 也 可 以 省 略 


版 左边 下 未 的 长 度 ( 也 只 能 是 最 左边 的 下 标 ), 编 详 器 会 根据 初始 化 值 的 个 数 推断 出 它 的 长 度 ， 

如 果 数 组 的 长 度 比 及 提供 的 初始 化 值 的 个 数 要 多 ， 剩 余 的 儿 个 元 素 会 白 动 设 改 为 0。 如 
果 元 素 的 类 型 是 指针 ， 邦 么 它们 被 初始 化 为 NULL， 如 中 元 素 的 类 型 是 oat， 那 么 它们 被 初 
始 化 为 0.0, 在 流行 的 IEEE 754 标准 浮 点 数 实 现 中 (IBM PC 和 Sun 系统 都 使 用 了 这 个 标准 ). 
0.0 和 0 的 位 模式 起 完全 -一举 的 。 


编程 挑战 





检查 位 模式 
号 一 个 简单 的 程序 ， 窒 查 在 你 的 系统 中 ， 浮 点 数 0.0 的 位 模式 是 否 与 整 型 数 0 的 位 模式 


下 面 区 -一 种 声 始 化 二 维 空 符 串 数组 的 方法 ; 

char VeSeraplesT [3 = { "beet", 
"bar ley', 
"basil', 
"broccoli', 
"beans'" }: 


”种 有 用 的 方法 是 建立 指针 数组 。 字 符 串 常量 可 以 用 作 数组 初始 化 值 ， 编 详 器 会 正确 地 
把 各 个 字 答 存储 于 数 织 中 的 地 址 。 因 此 : 
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char *vegetables.: = { "Carrot'"， 
"celery'", 
"CoOrn*, 
"Cilantro', 
"Crigpy fried patatoes" }; /* 没 问题 */ 


注意 它 的 初始 化 部 分 与 字符 “数组 的 数组 ”初始 化 部 分 是 -- 样 的 。 只 有 字符 串 常 嫩 才 加 
以 初始 化 指针 数组 。 上 指针 数组 不 能 由 非 字符 串 的 类 型 育 接 初始 化 : 


int *weights!i] = { jf* 无 法 成 功 编译 wy 
{1 
{6, 7}, 
{8, 9, 10} 
] ; /* 无 法 成 功 编译 */ 


如 果 想 用 人 这 种 方法 对 激 组 进行 初始 化 ， 可 以 创建 几 个 单独 的 数 级 ， 然 后 用 这 些 数组 名 米 
初始 化 原先 的 数组 。 


int row_l1{] 
int row_2[] 
int row_31} 


{1，2，3，4，5，-1}; /* -1 是 行 结束 标志 */ 
{£, -1}; 
{8, 9, 10, -1}; 


int *weight[] = i 
row_1, 
row_2, 
row_3 
了 
下 - 章 讨论 指针 时 会 对 这 方面 的 内 容 作 进一步 的 描述 。 不 过 ， 现 在 让 我 们 还 是 先 轻松 
下 。 


9.7 轻松 一 下 一 一 软件 /硬件 平生 


要 想 成 为 -名 成 功 的 程序 员 ， 必 须 对 软件 /硬件 的 平衡 有 - -个 良好 的 理解 。 这 里 有 一 个 例 
子 ， 我 是 从 朋友 的 则 友 那 里 听 来 的 。 许 多 年 以 前 ， 有 - -家 大 型 的 邮购 公司 使 用 一- 台 提 的 IBM 
古董 级 的 大 型 机 来 维护 客户 姓名 和 地 址 数据 库 。 这 种 机 器 根本 没有 批 处 理 控 制 机 制 (batch 
control mechanism): 

这 种 IBM 系统 已 经 过 时 了 ， 所 以 它 很 自然 地 被 一 个 Burroughs 系统 所 取代 。 看 看 这 是 什 
么 年 代 的 事情 况 ，Burroughs 或 称 “Rubs-rough”{ 使 动 地 擦 )， 这 是 人 人 们 对 它 的 字 坪 顺序 可 
作 变 换 后 的 戏称 白 20 世纪 80 年 代 中 期 与 Sperry 合并 生产 Unisys 之 后 便 销 声 匿 迹 了 。 当 时 
正 是 数据 处 理 大 行 其 道 共 时 候 ， 这 台 IBM 机 器 -- 直 入 个 不 停 , 连夜 班 也 加 上 了 了。 夜班 操作 员 
的 惟一 任务 就 是 等 待 ， 鼻 至 白 关 的 工作 结束 ， 然 后 在 夜间 每 隐 一 定时 间 启 动 - -个 新 的 任务 ， 
总 共 要 启动 4 个 任务 。 
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数据 处 理 的 管理 少 (Ruje Goldberg) 认 识 人 下， 如 果 他 可 以 找到 一 种 方法 让 机 器 答 隔 … 定 时 
间 启 动 :个 批 处 邢 作 务 ， 季 就 可 以 解放 伟 址 操作 员 ， 让 他 去 上 白班 、 卫 M 表示 可 以 为 系统 的 
软件 进行 升级 ， 提 供 批 处 理 功能 ， 但 索 价 高 达 数 万 天元 。 淡 人 愿意 为 这 样 “人 台 快 被 淘汰 的 机 
占 花 这 么 多 的 钱 。 结 果 ， 这 人 台 机 器 被 分 成 几 块 ， 每 块 部 号 一 个 终端 相连 。 这 样 就 可 以 安排 食 
间 的 工作 了 ， 机 器 的 每 一 块 邦 由 不 同 的 终端 进行 忆 动 。 每 个 终端 邦 可 以 进行 独立 设 首 ， 只 要 
加 车 键 : 按 ， 任务 就 会 启动 。 管 埋 者 接着 设计 并 建造 了 4 个 设备 ， 称 之 为 “幽灵 于 指 ”” 如 图 
9-10 所 示 。 


Lego 积 木 
一 


网 车 刍 
EE a 


图 9-10 幽 兴 手指 


伍 天 晚上 ， 在 每 个 终 问 的 控制 上 启动 “幽灵 手指 ”。 凌晨 2 时 ， 第 -个 闹钟 响起 ， 阅 钟 上 
的 发 条 会 卷 紧 一 根 线 ， 拉 出 一 个 栓 ， 使 一 块 乐章 积 本 鼎 邱 到 加 车 键 |。 然后 乐高 积木 其 迅速 
中 起 ， 以 免 键 反弹 战 重复 市 键 ， 这 样 什 务 便 启动 了 。 

尽管 每 个 人 都 对 这 种 识 计 感到 好 笑 ， 伺 它 整 整 工 作 了 6 个 月 ， 直 色 新 机 器 上 瑟 5 新 系统 
投入 使 用 还 没 几 个 小 时 ，Burroughs 和 IBM 的 系统 上 程 师 都 请 求 得 到 一 块 素 丰 上来 的 这 些 
Rube Goldber 设备 。 这 正 是 成 功 软件 /硬件 半 衡 的 实质 所 在。 











玩 转 数组 /指针 参数 
char ga[] = “abcdefghijklm"; 


void my_array_func{char ca[10]} 


{ 
printf{" addr of array param = %#x \n",&ca); 
printfi" agegr tca[0]} = 多 xx An ，&fca[fO]l) : 
printf{" addr (Ca[1]) = %#x ‘\n", &{ca[ll]});; 
printf{" ++Ca = $#x \N\N", ++Ca}; 

} 


void my_pointer_funcichar *pa) 
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aAddr 
" addr 
" addr 


i 


" adgr 
" addr 
" addr 


第 9 章 尚 论 数组 


of Etr param = $%4#x Sn" pas; 
tcaltly = StHx “nNn", glipaloll i; 
‘Ea1l]} = SH#x Sn， 人 (Da[L 
一 SS#x \N", ++2Aa)T 


of q'sbal array = eHx “nN", &ga’,} 


{eald}) = %#x An x(ga[d]!l:;; 
tc 和 [二 ]) = Sx Srin', &tgqalil}}; 


my_array_funciga}; 


my_pointer_func'iga}: 


{ 
princfi" 
UrintEt 
Printil 
Erinifti 

} 

mailni) 

{ 
wat. Ft 
orletit 
orkmu Ed 

} 


输出 结果 如 下 : 


ddr ct 


globar: 


adcdr ligal98]}) = 
addr (‘ga[il}) = 


array = Ox20900 
X70300 
Jx29901 


addr of array param = Vxeffffa'4d 
acqr lcald]) = 
aaGoT 人 cal1]) = 


+C 二 


0x20901 


Dx209300 
0X20901 


addr of pLr param <- Oxeffffald 
addr {pa[l0l1) = 


addr {pau 


[1 ) = 
DOx20901 


vx20900 
ox70901 


初 看 上 上 去 似乎 有 点 奇怪 ， 数 组 参数 的 地 址 和 数组 参数 的 第 一 个 元 素 的 地 址 竟然 不 一 样 ， 


但 事实 就 是 如 此 . 


你 可 以 跟 C 程序 员 新 手打 赌 , 看 看 在 这 种 情况 下 用 sizeof0) 会 是 什么 结果 , 你 或 许可 以 赢 


一 大 把 钱 ， 
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再 论 指针 





千 万 不 要 忘 了 ， 当 体 :把 一 个 手指 指向 别人 的 时 候 ， 你 手 上 的 另外 还 有 3 个 手指 指向 了 你 


一 一 落 柳 襄 恋 放 授 语 


10.1 多 维 数组 的 内 存 布 局 


多 维 数组 在 系统 编程 中 并 不 常用 。 所 以 ， 江 不 奇怪 的 是 ，C 语 占 并 未 像 其 他 语言 所 要 求 
的 那样 定义 了 详细 的 运行 时 程序 来 支持 这 个 特性 。 对 十 共 此 结构 如 动态 数组 ， 程 序 员 必 须 使 
用 指针 显 式 地 分 配 和 操纵 内 存 ， 而 个 是 帆 编 译 器 自动 定 成 。 男 外 还 一 些 结构 (作为 参数 的 
多 维 数组 )， 在 C 语言 中 并 没有 一 般 的 碟 式 来 表达 。 林 总 将 讲述 这 些 上 题 。 现 在 ， 每 个 人 部 
经 熟悉 了 多 维 数组 在 内 闻 中 的 布局 ， 如 果 我 们 具有 以 下 声明 ; 

char Ppeaf41[6]:; 


有 些 人 把 二 维 数组 看 目 是 排列 在 “ 张 皮 格 中 的 一 行 行 的 一 维 数组 ， 如 图 10-1 所 示 。 


geafill2j 





图 10-1 假想 中 的 二 维 数 纪 内 存 布局 
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C 专家 编程 


事实 上 系统 绝 不 允许 程序 按照 这 种 方式 存储 数据 。 单个 苞 素 的 在 信和 引用 实际 上 是 以 线 
性 形式 排列 在 内 存 中 的 ， 如 图 10-2 所 示 。 


peall]l2] 
pealol peal i] peal2] peal3] 


图 10-2 实际 上 的 三 维 数 组 内 存 布局 
数组 下 标的 规则 告诉 我 们 如 何 计算 左 值 pealillj]， 首 先 找 到 pea 所 的 位 置 ， 然 后 根据 偏 移 
量 四 取得 字符 。 因 此 ，pealilj] 将 被 编译 器 解析 为 
yx (xfPER + 2) + j) 


但 是 ‘这 正 是 关键 所 在 !)，“peafi]” 的 意思 将 随 pea 定义 的 不 同 而 变化 。 我 很 快 将 解释 
这 个 表达 式 ， 但 首先 让 我 们 看 一 下 C 语言 中 最 常见 最 重 此 的 数据 结构 ， 指 自学 符 串 一 维 指 针 


10.2 ”指针 数组 就 是 Hliffe 向 量 
可 以 通过 声明 - -个 一 维 指针 数组 , 其 中 每 个 指针 指向 一 个 字符 趾 ! 来 取得 类 似 -- 维 字符 数 
组 的 效果 。 这 种 形式 的 声明 如 下 ; 


char *peal[l41: 


软件 信条 





注意 声明 的 语法 


注意 char *tumip[23] 把 ，“turnip” 疡 明 为 一 个 具有 23 个 元 素 的 数组 ， 每 个 元 素 的 类 型 是 
一 个 指向 字符 的 指针 (或 者 一 个 字符 串 一 一 单纯 从 声明 中 无 法 区 分 两 者 】。 可 以 假想 它 两 边 
加 上 了 括号 一 一 (char *)tunip[23]。 这 跟从 左 至 右 读 时 看 上 去 的 样子 (一 个 指向 “有 具 有 23 个 字 


这 里 我 们 略微 进 行 了 简化 一 一 指针 实际 上 蚌 声 明 为 指向 单个 字符 的 。 但 是 如 玉 定 义 为 指向 字符 的 指针 ， 就 存在 -种 可能 宪 就 
足 其 他 字符 可 能 紧邻 着 它 存储 ， 陪 式 地 形成 了 一 个 字符 册 , 像 “* 面 这 样 的 记 册 
char tt* rhubarb[41) [7;; 
才 是 真正 声 衣 了 “个 指向 字符 串 的 指针 数组 。 在 实际 代码 中 丛林 曾 使 用 过 这 种 形式 ， 包 为 它 不 改 改 地 限制 了 所 指向 的 数组 的 
发 度 【从 能 恰好 为 7 。 
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第 10 章 ” 再 论 指 针 


符 类 型 元 素 的 数组 ”的 指针 ) 不 一 样 。 这 是 因为 下 标 方 括号 的 优先 级 比 指针 的 星 号 高 ， 关 于 
声明 语法 的 分 析 ， 第 3 章 已 经 作 了 详细 介绍 ， | a 

用 于 实现 多 维 数组 的 指针 数组 有 多 种 名 和 F， 如 “Tiiffe 同 量 "~“display” 或 “dope 汰 组” 
display 在 英国 也 用 米 表 示 个 指针 向 量 ， 用 于 激活 “个 在 词法 上 封 财 的 过 程 的 活动 记录 《〈 作 
为 “″ 个 静态 结 点 后 面 跟 个 链 上 ”的 奉 代 方案 )。 这 种 形式 的 指针 数组 是 “种 蝇 大 的 编程 技 
吃 ， 在 C 语言 之 外 取得 了 广泛 的 应 用 。 图 20-3 显示 了 这 样 的 结构 。 


ET | 


IO 2 3 [4] [5] 






pea[l1](21/ 


图 10.3 ”指向 字符 中 的 指针 数组 


这 种 数组 必须 用 指向 为 字符 串 而 分 配 的 内 存 的 指针 涝 行 初 始 化 ， 避 以 在 编译 时 用 .个 常 
量 初 始 值 ， 也 可 以 在 运行 过 用 下 面 这 样 的 代码 进行 补 始 化 ; 

于 

pea[j] = malloc(61, 

另 一 种 方法 是 一 次 性 地 用 malloc 分 配 整 个 xXy 个 数据 的 数组 ， 

mailo{row_sirze * column size * Sizeofichar' ) 
然后 ， 使 用 一 个 循环 ， 有 几 指 针 指向 这 块 内 存 的 各 个 区 域 。 整 个 数组 保证 能 够 存储 在 连续 的 内 
存 中 ， 即 按 C 用 十 分 配 静 态 数 组 的 次 序 。 它 减少 了 调用 malloc 的 维护 性 开销 ,但 缺点 起 当 处 
理 完 一 个 字符 串 时 无 法 单独 将 其 释放 。 





当 你 看 见 squashifillj 这 样 的 形式 时 ， 你 不 知道 它 是 怎样 被 声明 的 ! 


两 个 下 标的 二 维 数组 和 一 维 指针 数组 所 存在 的 一 个 问题 是 : 当 你 看 到 squash[i 付 这 祥 的 
引用 形式 时 ， 你 并 不 知道 squash 是 声明 为 ， 
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int squasn[2371121; As int 类 型 的 二 维 数组 */ 


或 是 

int *squast[23]; Ar 23 个 int 类型 指针 的 Tlifrfe 向 量 sy 
或 是 

int **gquash; 1* :nt 类 型 的 指针 的 指针 */ 
或 甚至 是 


int (*squash) [12];  /* 类 型 为 int 数组 { 长 度 为 12) 的 指针 *#/ 
这 有 点 类 以 在 通 数 内 部 无 法 分 状 传 递 给 函数 的 实 参 究竟 是 一 个 数组 还 是 一 个 指针 。 当 然 ， 基 
于 同 祥 的 理由 : 作为 左 值 的 数组 名 被 编译 器 当 作 是 指针 。 
在 上 面 凡 种 定义 中 ， 都 可 以 使 用 如 squashfi][j] 这 样 的 形式 ， 尽 管 在 不 同 的 情况 中 访问 的 
实际 类 型 并 不 相同 。 


ar 





i 


与 数组 的 数组 一 样 ,一 个 Tliffe 向 量 中 的 单个 字符 也 是 使 用 两 个 下 标 米 引用 数组 中 的 元 素 
《如 pea 上 ])。 指 针 下 标 引 ,所 的 规则 告诉 我 们 peafi] 菇 被 编译 器 解释 为 ; 


*{*ipea + 1I) + j) 


是 不 是 觉得 很 熟悉 ? 应 该 是 这 样 。 它 和 一 个 多 维 数 织 引用 的 分 解 形式 完全 一 样 ， 存 许多 
C 语言 书 中 就 起 这 样 解释 和 多。 然而 ， 这 里 存在 一 个 很 大 的 问题 ， 尽 管 这 两 种 下 标 形式 在 源 代 
码 里 看 上 大 是 一 样 ， 而 且 被 编译 器 解释 为 同一 种 指针 表达 式 ， 但 它们 在 各 自 的 情况 上 下 所 引用 
的 实际 类 型 并 不 相同 。 表 10-] 和 表 10-2 显示 了 这 种 区 别 ， 





表 10-1 一 个 数组 的 数组 char a[4][6] 
char al[4]1[6] 一 一 -个 数组 的 数 红 


在 编译 器 符号 表 中 ，a 的 地 址 为 9980 

运行 时 步骤 1: 取 i 的 伸 ， 把 它 的 长 度 调整 为 行 的 宽度 《这 里 是 6)， 然 后 加 到 9980 上 

运行 时 步骤 2: 取 j 的 值 , 把 它 钓 长 度 调整 为 一 个 元 素 的 宽度 (这 失足 1),， 然后 加 到 前 面 记得 出 的 结果 上 。 
运行 时 步骤 3， 从 地 址 《998U+i*scale-factor1+j*scale-factor2》 中 取出 内 容 。 


af 
癌 | 
alDl a[l] al21 4[3] 


char a[4][6] 的 定义 表示 a 是 一 个 包含 4 个 元 素 的 数组 ， 每 个 元 素 是 一 个 char 类 型 的 数组 (长度 为 6)。 所 以 
合 找 到 第 4 个 数组 的 第 i 个 元 索 〈 前 进 6 个 宁 节 )， 然 后 找到 数组 中 的 第 j 个 元 素 。 
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第 10 章 再 论 第 针 
过 10-2 字符 串 指针 数组 中 的 char “p[4] 


char *p[4] 一 一 个 字符 串 指针 数组 

在岗 详 胡 的 符号 表 中 ，P 的 地 由 为 4624 

运行 时 步 又 1: 取 i 的 值 ， 弱 以 表 针 的 宽度 (4 个 字 节 )， 并 把 结果 加 到 4624 上 。 
过 行 时 步骤 2， 从 地 坡 【4624-4xi) 起 出 内 容 ， 为 “5081” 

运行 时 步 豆 3: 取 j 的 值 ， 乘 以 元 素 的 宽度 〈 这 里 是 1 全 宁 节 ) ， 并 把 结果 加 到 5081 上 
运行 时 步 双 4， 从 地 霜 《5S081+j*1》 取出 内 容 


pfijlil 
PIYDI1 
5081 0 
bmw 5 10 18 | rn 
44624 4624+1+*4 5081 +1 +2 +3 +4 ... 


char *p[4j 的 完 义 胡 示 Pp 明 一 个 包含 4 个 元 这 的 数组 ,每 个 元 熔 为 一 个 指向 char 的 指 划 :所 以 除 彰 指针 已 
经 指 网 子 符 【或 字符 数组 ) ， 省 则 查找 过 程 无 法 完成 ， 假 定 每 个 指针 都 给 定 了 -一 个 值 ， 闭 么 但 六 过 程 先 
找 色 数组 的 第 让 个 元 素 〈 每 个 工 素 均 为 指证 ) ， 取 出 指针 的 值 ， 加 七 编 物 最 j， 以 此 为 地 址 ， 到 出 地 此 的 
内 容 ， 

这 个 过 程 之 历 以 可 行 是 因为 第 9 章 的 规则 2 -个 下 榨 娩 终 相当 于 指针 的 筒 移 基 。 因 此 ，turoipfjj 选 幸 
一 个 邢 素 ， 也 就 足 -个 指针 ， 然 后 使 用 上 标 [] 引 用 指针 ， 产 生 * 【指针 AHj) , 它 押 指向 的 是 -个 单字 符 ， 这 仪 
仅 是 让 3 和 PC2] 的 -一 种 扩展 ， 矢 们 的 结果 都 是 个 字符 ， 正如 我 们 在 及 - 帝 所 见 到 的 那样 。 








10.3 在 锯 类 状 数组 上 使 用 指针 


iliffe 向 量 是 一 种 旧式 .的 编译 器 编写 技巧 ， 最 初 用 于 Algol-60。 它 们 原先 用 于 提高 数组 
访 河 的 速度 ， 当 时 的 机 器 内 存 有 限 ， 通 常 在 内 存 中 只 存储 数组 的 部 分 数据 ， 这 个 技巧 也 有 
助 于 简化 管理 任务 。 在 现代 的 系统 中 ， 这 两 个 用 途 都 已 剖 无 必要 ， 但 Tliffe 向 量 在 另外 两 个 
方面 仍然 共有 价值 ， 存 储 各 行 长 度 不 -- 的 表 以 及 在 一 个 函数 调用 中 传递 -个 字符 时 数组 。 
如 果 需 要 存储 50 个 字符 号 ， 矢 个 字符 串 的 最 大 长 度 可 以 达到 255 个 字符 ， 可 以 声明 下 面 的 
二 维 数组 : 


char carrot [50] [2561; 
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巳 专家 编 臣 

它 声 明了 50 个 字符 第 ， 其 中 每 一 个 都 保留 256 字 节 的 空间 ， 同 使 右 些 学 符 串 的 实际 长 度 
上 到 一 两 个 学 节 。， 旭 果 经 常 这 样 做 ， 内 存 的 滔 费 很 大 。 一 种 替代 方法 就 是 使 用 字符 串 指针 数 
组 ， 注 总 它 的 所 有 第 级 儿 组 并 不 需要 长 度 部 相同 ， 如 图 10-4 所 示 。 


ni 


tumip 101 
1 
[2] 
13] 
[4} 
[5] 


图 10-4 ” 锚 贞 状 字符 串 数 握 


如 朱 声 明 一 个 字符 中 指针 数组 ， 并 根据 需要 为 这 些 字符 串 分 本 内 存 ， 将 会 人 人 节省 系统 
资源 ， 有 些 人 把 它 称 作 “ 银 齿 状 数组 ”是 因为 它 右 端 的 长 度 不 一 。 可 以 通过 用 字符 出 指针 填 
充 lliffe 问 量 米 创建 一 个 这 种 类 型 的 数组 ,学 符 串 指针 可 以 直接 使 用 现 有 的 , 也 可 以 道 过 分 配 
内 存 创建 … 份 现 有 字符 串 的 新 鲜 拷贝 。 图 10-5 显示 了 这 黄种 方法 。 


CNAAr *turnip[UMEFTERN]; 
char my_string[] = “your messadge Lere": 


A* 共 学 字符 市 *， ji* 捞 贝 字符 申 */ 
urnip[li. = krvy_stringT0]; turnip[jl1 = 
mallocl s.rien(my_strinyg} + 7 ); 








strepy {turnipij], my_string}); 





图 10-5 创建 一 个 锯 具 状 数组 


只 要 有 可 能 ， 尽 旦 不 业 选 择 拷贝 整个 字符 串 的 方法 。 如 果 需 要 从 两 个 不 问 的 数据 结构 访 
问 它 ， 找 贝 一 个 指针 比 财 由 整个 数组 快 得 多 ， 空 间 也 节省 很 多 。 田 一 个 可 能 影响 性 能 的 因素 
是 fliffe 向 量 可 能 会 使 字符 捉 分 配 于 内 存 中 不 同 的 久生 中 。 这 就 违反 了 局 部 引用 的 规则 ( -次 
读 写 的 数据 位 于 同 -… 页 面 4), 并 导致 更 加 频繁 的 页 面 交换 ， 其 体 如 何 取 次 于 怎样 访问 数据 以 
及 访问 的 频 度 。 
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ET, 


CM 
SN 


数组 和 指针 参数 是 如 何 被 编译 器 修改 的 


“数组 名 被 改写 成 一 个 指针 参数 ”规则 并 不 是 递归 定义 的 。 数 组 的 数组 会 被 改写 为 “ 数 
组 的 指针 ”， 而 不 是 “指针 的 指针 ” 。 


实 参 所 匹配 的 形式 参数 
数组 的 数组 cnar c[8] {10]; chart*) {10]; 数组 指针 
指针 数组 CAaar *c[15]; Char **o,; 指针 的 指针 
数组 指针 ( 行 指针 ) cnar {*c) [64]; char (xc) [641; 不 改变 
指针 的 指针 CNAaAr **e; char **c; 不 改变 


你 之 所 以 能 在 main() 坊 数 中 看 到 char **argy 这 样 的 参数 ， 是 因为 argy 是 个 指针 数组 { 即 
char *argy[] ) 。 这 个 表达 起 被 编译 器 改写 为 指向 数组 第 一 个 元 素 的 指针 ， 也 就 是 一 个 指向 指 
针 的 指针 。 如 果 argv 参数 事实 上 被 声明 为 一 个 数组 的 数组 (也 就 是 char argv[10][15j ) ， 它 
将 被 编译 路 改写 为 char(* argy)[15]( 也 就 是 一 个 字符 数组 指针 )， 而 不 是 char *#argv。 


只 适用 于 高 级 学 生前 材料 

让 我 们 花 点 时 间 ， 回 腑 一 下 图 9-8“ 多 维 数组 的 存 健 ”。 看 看 图 左边 标 为 “ 兼 窑 类 型 ”的 
变量 是 如 何 与 对 应 的 被 声明 为 函数 参数 的 数组 (如 上 表 所 示 ) 正确 匹配 的 。 

这 并 不 令 人 吃惊 。 图 9-8 显示 了 表达 式 中 的 数组 名 起 如 何 变 成 指针 的 ， 上 面 的 表格 显示 
了 作为 函数 参数 的 数组 名 是 如 何 变 成 指针 的 。 这 两 种 情况 都 受 一 个 相似 规则 的 支配 ， 就 是 在 
特定 的 上 下 文 环境 中 ， 数 组 名 被 改写 为 指针 。 

图 10-6 显示 了 所 有 有 效 代 码 的 组 合 。 我 们 可 以 发 现 : 

“3 个 函数 都 接受 同样 类 型 的 参数 , 就 是 -个 [2][3][5] int 型 三 维 数组 或 是 一 个 指向 [3][5] 
int 型 二 维 数组 的 指针 。 

。 3 个 变量 : apricob p, *q 都 匹配 所 有 3 个 函数 的 参数 声明 。 


编程 挑战 





检验 一 下 
键入 图 10-6 中 的 CC 代码， 亲手 运行 一 下 。 


[ee 
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Tb drLGotTel [lL 


TY funoczior Yt Anrient, 全 沁 


Ty .function 2 apricot 1， 


My SACt iON i: Poricnt+ 1 


lr py 3 5 = anricot,; 


my._function lip is 


my_functior 21 Dn }} 


TY EU LOr St 3 


tt Eq) [RT TI) EPLICOt 


Ty_function_ 1 


MY Not 


ty_function 3t oa 1; 





图 10-6 所 有 有 效 代 码 的 组 合 


10.4 向 国 数 传递 一 个 一 维 数组 


在 C 洛 吉 中， 任何 一 给 数组 均 可 以 作为 函数 的 实 参 。 彤 参 被 改写 为 指 间 数组 第 个 元 素 
人 

， 增加 一 个 额外 的 套数， 表示 元 率 的 数 朋 〈argc 就 是 起 这 个 作用 )。 

。 赋予 数组 最 后 一 个 元 素 一 个 特殊 的 值 ， 提 示 它 龙 数 组 的 旦 部 〈 字 符 串 结尾 的 40” 字 
人 的 元 素 值 在 数 放 中 嘲讽 ， 

-- 维 数 纽 的 情况 要 复杂 些 , 数组 被 改写 为 指向 数组 第 - 行 的 指针。 并 存 过 于 两 个 约定 ， 
ee 男 一 个 用 于 提示 所 有 行 的 结束 。 提 示 单 行 结束 可以 使 用 一 维 
数组 所 用 的 两 种 方法 ， 提 示 所 有 行 结 束 也 串 以 这 样 。 我 们 所 接收 的 是 一 个 指向 数组 第 一 个 元 
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素 的 指针 : 每 次 当 对 指针 执行 白 增 操作 时 ， 指 针 就 指向 数组 中 十 一行 的 起 始 位 置 ， 但 怎 么 知道 
指针 到 达 了 数组 的 最 后 了 蛇 ? 我 们 可 以 增加 一 个 额外 的 行 ， 行内 记 有 元 素 的 值 都 是 不 可 能 在 : 
阁 弓 正音 元 en 呈 对 指针 进行 月 增 操作 时 ， 革 对 它 进 行 检 
从， 看 看 它 是 合 到 达 了 那 - 一 行 ,为 一 种 方法 是 ， 定 义 个 额外 的 人 参数， 提示 数组 的 行 数 。 


10.5 ”使 用 指针 向 的 数 传递 一 个 多 维 数 组 


Os A et A 但 起 还 存 件 一 个 问题 ， 
就 是 如 何在 前 数 内 部 声明 … 今 一 维 数组 参数 ， 这 玫 起 让 正 的 麻烦 所 在 。C 语言 没有 办 法 攻 达 
“这 个 数组 的 边界 在 不 同 的 调用 中 可 以 变化 ”这 个 概念 .C 编 洋 肉 必须 要 知道 数组 的 边界 ， 以 
便 为 下 林 引 用 产生 正确 的 代码 ， 从 技术 上 说 ， 也 可 以 在 运行 时 处 覃 才 知 道 数 纽 的 边 四 ， 侧 革 
扩 多 共 他 说 言 就 是 这 样 做 的 ， 但 这 种 做 法 违背 了 CC 语 主 的 滩 计 理念 

我 们 能 够 采取 多 最 好 方法 就 是 放弃 传递 一 维 数组 ， 把 array[x]lyj 这 样 的 撒 臣 改写 为 一 个 
一 维 数 组 array[x+1|， 它 的 元 素 类 型 是 指 回 atray[y] 的 指针 。 这 样 就 改变 了 问题 的 性 质 ， 而 改 
八 后 的 门 题 是 我 全 已经 解决 了 的 。 大 数 纽 最 后 的 那个 元 素 array[x+1] 里 存储 -个 NULL 指针 ， 
提 汞 数组 的 结束 。 


TAM ET oT A PN RAN re me oosesvse -vv 


软件 信条 


在 C 语言 中 ， 没 有 办 法 向 函数 传递 一 个 普通 的 多 维 数组 


这 是 因为 我 们 需要 知道 每 一 维 的 长 度 ， 以 便 为 地 址 运算 提供 正确 的 单位 长 度 ， 在 语言 
中 ， 我 们 没有 办 法 在 实 参 和 形 参 之 间 交 流 这 种 数据 【 它 在 每 次 调用 时 会 改变 ) 。 因 此 ， 你 必 
须 提供 除了 最 左边 一 维 以 外 的 所 有 维 的 长 度 ， 这 样 就 把 实 参 限制 为 除 最 左边 一 维 外 所 有 维 者 
必须 与 形 参 匹配 的 数组 。 





a em | 叶 ” 
Le 


tame pe TPE TSE Nero epee PT EN TA RT AAR Ne wori- 





invert_ in place{int ai]l[l3)15})}:; 

用 下 面 两 种 方法 调用 都 可 以 ; 

int EP[20] [3|1[3]; invert_in_ placetb) ; 

int LIS99] [3] [51;， invert_in placelb}); 

但 像 下 面 这 样 任意 的 三 维 数 组 ， 

nt failslfi0]i5. 5]; invert_in placettails1); yy 无 法 通过 编译 */ 
:nt faizs21999) [13 16]; invert_in placelfaiis2); /* 无 法 通过 编译 *+/ 


却 是 无 法 通过 编译 器 这 一 关 的 ， 


TY a 
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一 维 或 更 多 维 的 数组 元 法 在 C 语 言 中 用 作 一般 形 式 的 参数 。 你 无 法 向 函数 传递 … 个 普 ; 
的 多 维 数组 。 可 以 向 函数 传递 预先 确定 长 度 的 特殊 数组 ， 但 这 个 方法 并 不 能 满足 ` 般 情况 ， 
最 显而易见 的 方法 是 声明 一 -个 像 下 面 这 样 的 原型 ， 


10.5.1 方法 1 


my_functiont{int my_array[10] [20]}; | 

尺 管 这 是 最 简单 的 方法 ， 但 同时 也 是 作用 最 小 的 。 因 为 它 迫 使 函数 只 处 理 10 行 20 列 的 
int 型 数组 ,我 们 想 要 的 是 个 确定 更 为 普通 的 多 维 数组 形 参 的 方法 ,使 函数 能 够 操作 任意 长 
度 的 数组 注意， 多 维 数 毕 最 主要 的 一 维 的 长 度 《 最 左边 一 维 ) 不 必 显 式 写 明 。 所 有 的 函数 
都 必须 知道 数组 其 他 维 的 确切 长 度 和 数组 的 基地 址 。 有 了 这 些 信息 ， 它 就 可 以 一 次 “ 跳 过 ” 
个 完整 的 行 ， 到 达 下 一 行 。 

10.5.2 方法 2 

我 们 可 以 合法 地 省 路 第 一 维 的 长 度 ， 像 下 面 这 样 声 明 多 维 数 组 : 


my_function{(int my_array[] [20]): 

但 这 样 做 法 仍 不 够 充分 , 因为 每 一 行 都 必须 正好 是 20 个 整数 的 长 度 。 函数 也 可 以 类 似 地 
声明 为 ; 

mY_tuncticntfinttxmr array} [201) 

参数 列表 中 (* my_array) 周 围 的 括号 是 绝对 需要 的 ,这样 可 以 确保 它 被 翻译 为 一 个 指向 20 
个 元 素 的 int 数组 的 指针 ， 而 不 是 一 个 20 个 int 指针 元 素 的 数组 。 同 样 ， 我 们 对 最 右边 一 维 
的 长 度 必须 为 20 感觉 不 快 。 





一 致 性 数组 


按照 最 初 的 设计 ，Pascal 也 具有 和 CC 语言 同 种 的 功能 缺陷 一 一 没有 办 法 向 同一 个 函数 伟 
递 长 度 不 同 的 数组 。 事 实 上 Pascal 的 情况 更 糟 ， 因 为 它 甚至 不 能 支持 一 维 数组 的 情况 ， 而 C 
语言 倒 可 以 实现 , 数组 边界 是 函数 原型 的 一 部 分 ， 如 果实 参数 组 的 长 度 不 能 与 形 参 完全 匹配 ， 
就 会 产生 一 个 类 型 不 匹配 错误 。 像 下 面 这 样 的 Pascal 代码 是 非法 的 : 
var apple : array[l..10] of integer; 
Precedure invert!{ a: array[1l,..15] of integer; 
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invert (app1Le) ; { 无 法 通过 编译 }: 

为 了 弥补 这 个 缺陷 ，Pascal 标准 化 语言 协会 构思 了 一 个 概念 ， 称 为 一 致 性 数组 
(conformation arrays) 或许 取 名 为 “confuse'"em arrays i 混淆 他 们 的 数组 ) ”更 为 合适 ， 它 
是 一 种 协议 ， 用 于 实 参 和 形 参 之 间 数 组 长 度 的 通信 。 对 于 一 般 的 程序 员 而 言 、 这 个 方法 的 工 
作 原 理 并 非 一 眼 可见 ， 而 县 它 也 不 存在 于 其 他 的 主流 语言 中 ， 你 必须 像 下 面 这 祥 编 与 代 友 : 

precedure atifname; array[lo..hi: integer] cf char); 

数据 名 lo 和 mhi( 当 然 也 可 以 取 其 他 的 名 字 ) 所 对 应 的 数组 边界 在 每 次 调用 时 根据 实际 参数 
进行 填充 经验 显示 ， 许 多 程序 员 认 为 这 种 形式 只 会 把 事情 摘 得 更 乱 。 在 解决 了 普通 情况 的 
数组 参数 传递 问题 后 ， 语 言 的 设计 者 把 最 简单 的 字符 长 度 固 定 的 数组 这 种 情况 杭 成 了 非法 代 
码 : 





1 procedure alfname: array[1..70] of char}; 
EE ^---Expecteg igenrtifier 


这 种 语言 定义 的 方式 很 显然 与 许多 程序 员 预 期 的 行为 背道而驰 、 时 至 今日 ， 我 们 已 经 接 
到 无 数 的 技术 支持 电话 请 求 帮 助 。 在 Sun 的 编译 器 小 组 里 ， 每 隔 数 月 “Pascal 编译 器 Bug” 
的 报告 便 上 和 着 一 个 数量 级 ，Pascal 的 一 致 性 数组 另外 还 行 在 一 个 问题 ， 例 如 ， 一 个 一 至 性 字 
符 数 组 并 不 县 有 字符 囊 类 型 ( 因为 它 的 类 型 无 法 用 任何 数组 类 型 来 表示 】， 所 以 即使 它 是 一 
个 字符 数组 ， 它 也 不 能 作为 字符 事 和 参数 传递 ! 一 致 性 数组 形 参 会 给 Pascal 程序 员 带 来 更 多 的 
烦恼 ， 也 许 只 有 交互 式 IO 比 它 更 麻烦 。 更 糟糕 的 是 ， 有 些 人 正在 讨论 要 不 要 在 C 语言 中 增 
加 一 致 性 数组 ， 


rr ee A errr mr rt AAA A ae tr te whrteteNAeNT eNLE A A MA RR EE “全 mV et eet ttt ee WinNT oo 


10.5.3 方法 3 


我 们 可 以 采取 的 第 三 种 方法 是 放弃 二 维 数组 ,把 它 的 结构 改 为 -一 个 Tliffe 问 量 .也 就 是 说 ， 
创建 一 个 一 维 数组 , 数组 中 的 元 素 是 指向 其 他 东西 的 指针 。 回想 上 main0 哨 数 的 两 个 参数 ， 
我 们 已 经 习惯 了 看 到 char + argv{]; 的 形式 ， 有 时 也 能 看 到 char ** argv; 这 样 的 形式 ， 它 能 提醒 
我 们 怎样 分 析 这 个 声明 。 可 以 简单 地 传递 … 个 指向 数组 参数 的 第 一 个 元 素 的 指针 ， 如 下 质 不 
(用 于 - 维 数 组 )， 

Try_functjionfchar *“my_array); 

注意 :， 只 有 把 二 维 数 组 改 为 一 个 指向 向 量 的 指针 数组 的 前 提 下 才 可 以 这 样 做 ! 

lliffe 向 量 这 种 数据 结构 的 美感 在 于 : 它 人 允许 任意 的 字符 串 指针 数组 传递 给 国 数 ， 丛 必须 
是 指针 数组 ， 而 蕊 必须 是 指向 字符 串 的 指针 数组 。 这 是 因为 字符 串 和 指针 部 有 一 个 好 式 的 越 
界 值 (分 别 为 NUL 和 NULL)， 可 以 作为 结束 标记 。 至 于 其 他 类 型 ， 并 没有 一 种 类 似 的 通用 


! 花 括 量 是 Pacal 的 注释 缘 式 .一 一 译 省 注 
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且 吕 竺 的 值 ， 所 以 并 没有 一 种 内 植 的 方法 知道 何 时 到 达 数 组 其 -- 维 的 结束 位 曾 。 即 使 足 指向 
字符 中 的 指针 数组 ， 通 常 记 需要 - -个 计数 参数 argc， 记 录 字 符 串 的 数量 ， 


10.5.4 方法 4 


我 们 由 以 采取 的 最 后 一 种 方法 也 是 放弃 多 维 数 组 的 形式 ， 提 供 自己 的 下 标 方式 。 当 
Groucho Marx 许 论 “ 旭 果 你 把 轰 果 蔓 者 成 苹果 着 那样 ， 它 们 党 起 来 会 比 人 黄 更 像 本 -地 ”时 ， 
他 脑子 由 想 的 肯定 就 是 这 种 错综复杂 的 运 回 方法 。 

char_array [row_ sis23 II + j] = ,， 

这 很 容易 误 入 歧途 ， 而 且 会 让 你 困惑 ， 如 果 可 以 手工 做 这 些 事 情 ， 为 什么 还 党 到 使 用 编 
详 器 呢 ? 

已 之， 如果 多 维 数组 符 维 的 长 度 都 是 一 个 完全 相同 的 出 定 值 ， 烛 么 抒 它 传递 给 一 个 晒 数 
于 无 问题 。 如 果 情 况 更 曾 首 一些， 也 更 常见 一 些 ， 就 起 作为 函数 的 参数 的 数组 的 长 度 是 任 间 
的 ， 我 们 用 卡 面 的 方法 进行 进一步 的 分 析 : 

“- 维 数组 一 没有 司 题 , 但 需要 包括 一 个 计数 值 或 者 是 个 能 够 标识 越界 位 置 的 结束 
行 。 被 调用 的 疯 数 无 法 检 济 数组 参数 的 边界 . 正 因 为 如 此 ，gets0) 所 数 存 在 安全 漏洞， 从 而 和 导 
致 了 Intermet 蠕虫 的 产生 。 

”二 维 数组 一 一 不 能 直接 传递 给 函数 ， 但 可 以 把 矩阵 改写 为 一 个 . 维 的 Tiffe 向 量 ， 并 
使 用 相同 的 下 标 表 泵 方法。 对 于 字符 串 来 说 ， 这 样 做 是 可 以 的 ， 对 于 其 他 类 型 ， 需 要 增加 一 
个 记 数 什 或 者 能 够 标识 研 异 位 置 的 结束 符 。 同 样 ， 它 依赖 十 调 用 函数 和 被 调用 函数 之 闻 的 约 


十 。 





” 三维 或 更 多 维 的 数组 -一 都 无 法 使 用 。 必 须 把 它 分 解 为 几 个 维 数 更 少 的 数组 。 
对 多 维 数组 作为 参数 传递 的 支持 缺乏 是 C 语言 存在 的 - -个 内 在 限制 , 这 使 得 用 C 语言 i 
写 共 些 特定 类 型 的 程序 非常 出 难 〈 如 数值 分 析 算 法 )。 


19.6 ”使 用 指针 从 函数 返回 一 个 数组 
前 面 一 节 , 我 们 分 析 了 怎样 把 数组 作为 参数 传递 给 函数 。 本 节 换个 方向 讨论 数据 的 转换 ， 


从 函数 返回 -个 数组 。 
严格 地 说 ， 无 法 直接 从 函数 返回 一 个 数组 。 但 是 ， 可 以 让 函数 返回 一 个 指向 任何 数据 结 


构 的 指针 ， 当 然 也 可 以 是 一 个 指向 数组 的 指针 。 记 住 ， 声 明 必 须 在 使 用 之 前 。 一 个 声明 的 例 
子 是 


int {*paf(}}[20]; 

这 虫 ，paf 是 一 个 函数 ， 它 返回 一 个 指向 包含 20 个 int 元 素 的 数组 的 指针 。 它 的 定义 可 
能 如 下 ， 

int (APafit))[20] { 
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int (*pear) [20]; /* 声明 一 个 指向 包含 20 个 int 元 素 的 数组 的 指针 */ 


Pear = calloci?0, sizeof (int))},; 
ifl:pear}) ioncjmeicrror, 1)} 
return pear; 


} 

你 用 下 面 这 样 的 方法 来 调用 函数 ; 

int (*result} [207， /* 声明 -一 个 指向 在 食 25 个 ins 元素 的 数组 的 指针 >/ 
result = pafi}; 1* 调用 函数 */ 

(*rasult} [3] = 12， jx 访问 结果 数组 */ 


或 者 现 个 佬 样 ， 定 义 - 一 个 结构 : 


struct a_tag f 
iT 二 drray [20]; 
外 
struct a_tag my_func-ion() ! ,retarn y } 


用 下 由 的 方法 来 使 用 : 


X= y; 
X = my_functiont): 


如 采 要 访问 数组 中 的 元 素 ， 可 以 用 直面 的 方法 ; 
x.array[li] = 38; 


干 万 要 注意 ， 不 能 从 卫 数 中 返回 一 个 指向 哆 数 的 局 部 变量 的 指针 详 见 第 2 章 )。 





为 什么 NULL 指针 会 导致 printf 函数 崩 演 ? 


有 一 个 经 常 被 问 到 的 问题 是 : “为 什么 向 printt0) 浮 数 传 递 一 个 NULL 指针 会 导致 程序 的 
崩溃 ? ”人 们 似乎 觉得 可 以 像 下 面 这 样 编写 代 三 : 

char *p = NULL; 

A 

printf{"®s", 也) 
并 认为 它 不 会 崩溃。 顾客 们 有 时 会 抱怨 : “ 它 在 我 的 HP/IBMI/PC 上 不 会 崩溃 。” 他 们 希望 内 
Printf() 传 入 一 个 NULL 指针 时 ， 它 会 打印 出 室 字 符 串 。 

问题 在 于 C 标准 规定 %8 说 明 符 的 参数 必须 是 一 个 指向 字符 数组 的 指针 ， 由 于 NULL 并 
不 是 一 个 这 样 的 指针 ( 它 是 一 个 指针 ， 但 它 并 不 指向 一 个 字符 数组 ) ， 所 以 这 个 调用 将 陷入 
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“未 定义 行为 ”。 

由 于 程序 员 在 编码 时 出 了 觅 了 一 些 错误 ， 问 题 是 “你 希望 尽早 还 是 尽 晚 发 现 错误 ?”》” 如 果 
你 坚持 printf 应 该 能 够 处 理 -- 个 NULL 指针 ( 将 它 作为 合法 的 参数 ) 。 那 么 、 对 于 其 他 在 lipc 
中 的 详 通 数 , 是否 也 应 该 这 样 做 呢 ? 如 果 传 递 给 Strcmp() 了 还 数 的 参数 之 一 是 一 个 NULL 指针 ， 
那么 strcmpO 通 数 又 该 怎样 处 理 它 呢 ? 体 希 望 让 hrintf 尽 可 能 地 揣摩 程序 员 的 意图 ( 很 可 能 使 
程序 在 以 后 陷入 更 大 的 麻烦 ) ， 还 是 想 让 程序 尽 可 能 早 地 发 现 错误 ? 

Sun ljbc 选择 了 第 二 种 六 法 。 其 他 一 些 libc 厂商 则 选择 了 第 一 种 方法 ， 也 许 它 对 程序 员 
更 为 友好 ， 但 在 安全 性 上 却 打 了 折扣 ， 这 也 涉及 到 一 致 性 习题 ， 你 希望 对 libc 中 的 其 他 函数 
也 进行 扩展， 所 许 NULIL 指针 大 数码 ? 


Ann ee RR EST EA MF TA OI A NA A mr 


10.7 使 用 指针 创建 和 使 用 动态 数组 


当 预 先 并 不 知道 数据 的 长 度 时 ， 可 以 使 用 动态 数 给， 绝 人 人 多数 共 有 数组 的 编程 讲 言 部 能 
够 什 运 行 时 说 置 数组 的 长 度 ， 它们 允许 程序 员 计算 需要 处 提 的 元 束 的 数 有 日， 然后 创建 一个 刚 
好 能 容纳 这 些 元 素 的 数组 。 册 出 比 较 悠 入 的 语言 如 Algol-60、PLA 和 Algol-68 等 也 夫 备 这 个 
功能 ， 比 较 新 的 语言 如 Ada，Fortran90 和 GNUC (由 GNUC 编 详 器 实 纲 的 语 同 版 本 》 等 也 
允许 声明 长 度 避 在 运行 时 设置 的 数组 。 

然而 ， 件 ANSI C 中 ， 数 组 是 条 态 的 一 数组 的 长 度 在 编译 时 全 已 确定 不 变 。 帮 这 个 领 
域 ，C 庄 言 的 支持 很 蚂 ， 你 甚至 不 能 使 用 像 下 而 这 样 的 常量 形式 ; 

const int limit = 100; 


char nluim[llimit]; 


error:intecral constant expression exoected (错误 ， 期 待 整 型 常量 表 法 式 ) 
我 们 不 起 本 “为 什么 “个 const int 不 能 被 当 作 一 个 整 型 常量 表达 式 ” 这 样 邻 大娘 坎 的 问 
题 。 在 C++ 中 ， 这 样 的 诸 匀 是 合法 。 
在 ANSIC 中 引入 动态 数组 应 该 是 比较 容易 的 ， 因 为 这 个 特性 所 寡 归 的 “前 加 艺术 {prior 
ar ”功能 已 经 存在 。 所 和 需要 做 的 就 是 就 是 把 标准 5.5.4 小 节 中 下 面 这 一 行 
direct-declarator | constant-expression or 


改 为 

Girect-decLaraLor [ expression so ] 

如 乐 去 除 这 个 人 为 限制 ， 数 组 的 定义 事实 上 会 更 简单 . - 些 。 如 果真 能 这 样 做 的 话 ，C 语 
讲 的 功能 将 会 得 到 增强 ， 而 县 仍 然 能 与 K&R C 保持 菊 容 。 由 十 委员 会 强烈 希望 与 C 语言 最 
初 的 简单 设计 保持 --- 致 ， 所 义 这 个 方案 仍然 没有 被 采纳 。 率 运 的 是 ， 除 此 之 外 仍然 有 办 法 实 
现 动态 数组 的 功能 〈 代 价 用 就 是 我 们 必须 亲自 做 一 些 指针 操作 明 )。 
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pA ep rr 


从 程序 的 信息 中 得 到 启发 


使 用 strings 实用 程序 从 二 进 制 文件 内 部 查看 程序 可 能 产生 的 错误 信息 是 很 有 帮助 的 . 如 
果 strings 已 经 被 国际 化 并 且 可 以 把 信息 输出 到 另 一 个 文件 中 ,你 其 至 不 需要 查看 这 个 二 进 制 
文件 。 如 果 用 strings 检查 yacc 程序 , 会 发 现 它 的 错误 信息 在 最 近 的 两 个 版 本 中 有 着 显著 的 不 
同 。 特 别 是 ， 错 误 信 息 : 


名 strings yacc 
让 many states (大多 的 状态 ) 
变 成 了 
% strings yacc 
de expand table of states (无 法 扩展 状态 表 ) 


原因 是 yacc 程序 被 入 级 ， 它 的 内 部 表现 在 是 动态 分 配 的 ， 可 以 根据 需要 进行 扩张 。 





软件 信条 











有 意义 的 错误 信息 


在 编译 器 中 有 时 也 会 己 现 有 趣 的 字符 串 . 据说 ， 下 列 字 符 串 都 是 从 Apollo C 编译 器 中 找 
到 的 : 

00 cpp says it's hopeless but zrying anyway (CDpp 表示 希 香 涡 臣 ， 但 它 尺 量 试 试 ) 

14 parse error: I just don’t get it ( 解 术 错误 ， 我 无 法 理解 它 ) 

15 YOU learried to prgram in Fortran, didn’t you? 

(你 是 从 Fortran 学 习 编 程 的 ， 是 不 是 ” ) 

我 最 喜欢 的 一 个 是 : 

033 linker attempting to "duct ape" this "gerbil’" of a program 

(链接 器 试图 “ 牢 牢 绑 住 ” 程 序 中 的 “ 活 足 乱 跳 的 沙 农 ” ) 

也 许 这 就 是 链接 器 又 称 作 捆 缚 器 的 原因 .… 

这 些 (可 能 是 伪造 的 1 信息 对 于 程序 员 而 言 可 以 当 作 是 玩笑 。 但是， 我 们 只 能 适度 地 使 


233 


C 专家 编 可 
用 山 默 。 有 一 位 程序 员 ( 不 是 Sun 公司 的 ) 在 网 络 驱动 程序 中 编写 了 一 条 信息 内 容 是 “Bad 
bcb; we're in big trouble now. ( Bad bcb: 我 们 现在 过 到 了 大 麻烦 ) ”这 条 信息 位 于 一 条 Switch 
语句 的 default 耶 印 中， 根 湛 协议 手册 ， 这 条 switch 语句 中 的 defaull 子 自 是 绝 不 会 被 执行 的 . 

自然 ， 事 实 上 这 条 语句 被 搞 行 了 。 而 且 ， 直 到 系统 投入 生产 使 用 后 才 出 现 这 条 Re 
行 的 情况 . 接收 到 这 条 信息 的 顾客 站 点 有 十 几 个 大 型 机 昼夜 不 停 地 运行 ,由 操作 员 抽 责 管理 
所 有 的 控制 台 信息 都 被 打印 出 来 ， ee 

当 这 条 信息 出 现时 ， 操 作 员 叫 来 了 他 的 上 司 。 当 时 大 约 是 早上 6 点 左右 ， 上 上司 赶紧 打 电 
去 给 厂商 的 程序 员 。 而 这 位 程序 员 所 在 的 地 方 是 凌晨 3 点 左右 【太平 洋 时 间 ) 、 那 位 上 司 向 
程序 员 解 释 道 ， 由 于 他 们 的 机 器 必须 连续 不 停 地 运行 ， 所 以 操作 员 必 须 非常 认真 地 对 待 所 有 
的 信息 ， 他 希望 厂商 能 说 明 一 下 这 条 信息 表示 什么 意思 

注意 这 条 信息 并 无 融 法 之 意 ， 它 告诉 程序 员 哪 里 出 了 问题 。 但 问题 在 于 它 不 必要 地 向 顾 
客 发 出 了 人 警告。 经 过 快速 修改 之 后 ， 这 个 程序 马上 推出 了 新 版 本 ， 这 条 信息 变 成 了 : 

“bufier control block 35 checksum fa:iled. { 绥 冲 区 控 击 岂 35 恰 验 和 失败 1 ， 

“pdckelL rejected - inform suppor, - Fot DrgeniL .1 耸 组 教 拒绝- 信息 支持 -并 非 某 各 1， 

对 于 此 类 的 罕见 信息 ， 用 两 行文 字 来 表示 是 可 行 的 ， 

信息 应 该 具有 启发 性 ， 而 非 煽 动 性 ， 并 且 要 避免 使 用 诸如 带 有 齐 污 性 、 口 语 化 ， 山 默 或 
者 过 张 的 非 专业 用 语 ,尤其 是 ， 如 果 你 规 规 类 和 地 这 样 做 ， 就 可 以 避免 在 凌晨 3 点 钟 旋 叫 醒 ， 


现在 我 们 讨论 C 语言 小 如 何 实现 动态 数组 。 清 系 紧 安全 带 ， 这 次 竟 学 习 之 旅 可 是 正常 的 
颠 航 噢 ! 它 的 基本 思路 就 是 使 用 malloc0 库 函数 〈 内 存 分 配 ) 来 得 旬 “个 指向 一 大 块 内 存 的 
扣 针 。 然后， 像 引 用 数组 一 样 引用 这 块 内 存 ， 其 机 理 就 是 个 数 弓 下 标 访 问 可 以 改写 为 一 个 
指针 加 上 偏 移 量 。 


#include <gstdlib.h: 
#include <stLdio.h> 


int size; 

char *dynamic; 

char input [10]; 

printfl("Please enter size of array: "); 
size = atoi (fgets{inpit, 7, stain}}; 
dynamic = {char *})ralloc {size)}: 


re Cr 一 昌 光 

dynamictsize-1l} = 27 

动态 数组 对 于 避免 预定 义 的 限制 也 是 非常 有 几 的 。 这 方面 的 经 典 例子 是 在 编译 器 中 。 我 
们 不 想 把 编译 句 符 号 表 的 记录 数量 限制 在 一 个 闫 定 的 数 自 上 ， 但 也 不 想 -开始 就 建 亲 -个 非 
常 着 巨大 的 固定 长 度 的 家 ， 这 样 会 导致 其 他 操作 的 内 存 空间 不 够 。 公 日 前 为 止 ， 这 些 内 容 还 十 
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比较 容易 理解 的 。 


人 
产品 的 质量 


几 年 前 ， 我 们 在 我 们 的 其 中 一 个 Pascal 编译 器 上 增加 了 一 些 代码 这样 ， 它 就 会 根据 需 
要 对 记录 头 文 件 名 的 内 部 表 进 行 增长 ， 一 开始 ， 这 个 表 具 有 12 个 空 的 Slot， 当 源 文件 能 套 的 
头 文 件 的 屋 数 超过 12 时， 表格 会 自动 进行 增长 以 处 理 这 种 情况 。 

所 有 真正 意义 上 的 软件 或 多 或 少 都 会 存在 一 些 Bug， 在 这 个 例子 里 ， 一 位 程序 员 编 码 有 
误 。 结 果 ， 当 编译 器 试图 增长 表格 时 ， 程 序 就 进行 信息 转 储 (并 中 止 ) 。 这 个 结果 非常 糟 烂 ， 
无 论 用 户 输入 什么 东 码 ， 编 译 器 都 不 应 该 中 止 。 

结 有 果 ， 在 欧洲 的 一 个 大 客户 那里 ， 这 个 错误 造成 了 一 个 特别 的 问题 。 这 家 顾客 有 一 套 大 
型 的 Pascal 软件 ， 用 于 发 电 控制 ， 他 们 想 把 它 移植 到 Sun 的 工作 站 中 。 这 套 软 件 的 大 多 数 术 
序 所 谍 套 的 头 文件 层 数 都 超过 了 1]2， 所 以 他 们 经 常 发 现 编译 器 进行 信息 转 储 。 此 时 ， 顾 客 犯 
了 两 个 错误 ; 一 是 他 们 没有 报告 这 个 错误 ; 二 是 他 们 没有 对 这 个 问题 进行 深入 的 调查 ， 

对 报告 的 问题 进行 修正 是 我 们 优先 级 最 高 的 任务 ， 但 我 们 只 能 修正 我 们 知道 的 问题 ( 即 
向 我 们 报告 的 问题 ) 。 在 Pascal 中 ， 头 文件 谈 套 层 数 很 深 的 情况 极为 罕见 ( 头 文件 机 制 甚至 
不 是 标准 Pascal 的 一 部 分 ) 。 无 论 是 我 们 的 测试 程序 还 是 其 他 顾客 都 不 曾 报 告 这 个 问题 ， 结 
果 ， 这 家 电力 公司 发 现在 编译 器 的 新 版 本 中 这 个 问题 依然 存在 ， 

但 此 时 这 个 问题 却 给 斌 家 公司 造成 了 很 大 危机 ， 数 百 万 美元 投资 面临 打 水 漂 的 危险 ， 多 
位 公司 副 总 (我们 公司 的 和 他 们 公司 的 ) 中 断 了 高 尔 夫 球 活动 ， 匆 缴 聚 在 一 起 商讨 对 策 ， 结 
果 ， 对 方 公司 派 踢 了 一 位 资深 工程 师 飞 到 美国 与 我 会 面 ， 要 求 修正 这 个 Bug， 我 是 编译 器 部 
门 第 一 个 见 到 这 个 Bug 的 重要 人 物 ! 我 们 立即 修正 了 这 个 Bug， 让 这 位 工程 师 带 着 打 好 了 补 
丁 的 编译 器 回 家 。 但 我 同村 对 一 个 事实 深 感 震惊 ， 如 果 他 们 稍微 花 点 时 间 调 查 一 下 这 个 问题 
的 起 因 ， 只 要 稍 做 修改 就 可 能 很 轻易 地 解决 这 个 Bug。 这 个 故事 的 教训 是 两 方面 的 : 

1. 向 客户 支持 中 心 报告 你 所 发 现 的 所 有 产品 缺陷 。 我 们 只 能 修正 我 们 知道 的 Bug， 而 且 
它 可 能 在 其 他 地 方 发 生 (【 息 们 的 另 一 个 撑 折 来 源 是 有 些 政府 机 构 报 告 了 问题 ， 但 出 于 “安全 
理由 ”甚至 拒绝 向 我 们 提供 产生 问题 的 代码 ， 即 使 他 们 对 代码 进行 了 一 普 安 全 方面 的 处 理 ) 。 

2. 禅宗 思想 和 软件 维护 的 艺术 都 建议 ， 你 应 该 花 点 时 间 调查 任何 所 发 现 的 Bug， 也 许 这 
些 Bug 可 以 很 容易 就 解决 掉 . 








拒 们 臭 正 需要 实现 的 是 使 表 具 有 根据 需要 自动 增多 的 能 力 ， 这 样 它 的 惟一 限制 就 是 内 存 
的 总 容量 。 如 果 你 不 昆 让 六 声明 一 个 数 弓 ， 而 是 在 运行 时 在 堆 上 分 配 数组 的 内 存 ， 这 可 以 实 
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现 这 个 日 标 。 有 … 个 库 函 效 realloc0})， 它 能 够 对 个 现在 的 内 存 块 大 小 进行 重新 分 配 (通常 
龙 使 之 扩大 )， 同 时 不 会 五 失 原 先 内 存 块 的 内 容 。 当 需要 在 动态 龙 小 增长 “个 项 目 时 ， 可 以 进 
行 如 下 操作 ; 

1. 对 表 进 行 检 合 ， 春 看 它 是 否 真 的 已 满 。 

2. 如 果 确 实 已 满 ， 使 用 realloc0 函 数 扩 嵌 表 的 长 度 。 并 进行 检查 ， 确 保 reallocO 抬 作成 
功 进行 。 

3. 企 表 中 增加 所 需要 的 项 目 。 

用 CC 代码 表示 ， 大 致 妇 下 ; 

int current_element = 0; 


int total,_cloement = 128; 
char *dynamic = mallocltotal_elament}); 


void add_element (char c}f 
ificurrent_eljement. == 上 otal_element - 1): 
total_eleinet *= 2， 
dynamic = [har *}realloc (dynamic, total element}: 
if {dynamic == NULL) errorf{f"Coundn’'t expangd the table');: 
} 
current_element++; 
dyriamiclcurrent_element] = CC 


} 
全 实践 中 ， 不 要 把 realloc0 消 数 的 返回 值 直 接 赋 给 字符 指针 。 如 果 realloc0 国 数 失败 ， 它 
会 使 该 指针 的 值 变 成 NULL， 这 样 就 无 法 对 现 有 的 表 进 行 访问 。 








编程 挑战 








动态 增长 你 的 数组 


编号 一 个 main() 程 序 ， 使 用 上 面 提 到 的 那个 澡 数 。 检 查 一 下 原先 的 数组 ， 并 填充 足够 的 
元 素 ， 使 之 调用 realiocO 函 执 进 行 扩张 。 


附加 分 : 

在 add_elementO 函 数 中 增加 几 末 语 身 ,使 它 可 以 负责 动态 内 存 区 域 的 初始 内 存 分 配 。 这 
祥 做 有 什么 优点 和 缺点 ? 该 怎样 使 用 setjmp(ylongjmpO 来 优雅 地 处 理 表 增长 过 程 中 出 现 的 错 
误 ? 
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这 种 模拟 动态 数组 的 技 态 奉 SunOS 5.0 版 本 中 得 到 本 很 广泛 的 使 用 。 所 有 时 竖 的 示 定 长 
度 的 表 (和 人们 在 实际 使 用 二 受到 限制 ) 部 进行 了 修改 ， 使 之 能 够 自动 增长 。 这 个 技巧 在 其 他 
许多 系统 软件 中 也 得 他 了 使 用 ， 如 编译 器 和 和 调试 器 。 作 [这 个 技 蕊 并 不 是 在 所 有 地 广 都 应 该 使 
用 ， 二 由 如 下 : 

， 当 一 个 大 型 表格 突然 应 要 增长 时 ， 系统 的 运行 速度 可 能 会 慢 下来， 而 且 这 在 什么 时 候 
发 和 是 无 法 预测 网 。 内 存 分 配 成 倍增 长 是 最 关键 的 原因 : 

， 重 分 配 操作 很 串 能 把 左 先 的 整个 内 存 块 移 人 刘 -个 不 同 的 位 绾 , 这 样 表格 小 元 素 的 地 址 
便 不 由 有 效 。 为 避 倪 麻 烷 ， 应 该 使 用 下 标 而 不 是 庆 素 的 上 地址。 

， 所 有 的 “增加 ”和 “删除 ”操作 都 必须 通过 蝎 数 来 进行 ， 这 样 才 能 维持 去 的 完整 性 。 
具 旦 这 样 一 来 ， 收 改 衣 所 涉 帮 到 的 东西 就 比 仅 仅 使 用 上 下 标 监 才 得 多 . 

“ 如 果 表 有 昌 项 日 数 至 减少 ， 司 能 点 沪 缩 小 在 并 释放 多 余 的 内 在 。 这 样 内 在 收缩 的 操 
作对 程序 的 运行 速度 有 很 人 的 影响 。 每 次 搜索 袁 格 时 ， 编 详 器 最 好 能 够 知道 任 -… 叶 纪 表 的 
大 小 

。 当 某 个 线程 对 表 进 行内 存 重 新 分 配 时 ， 你 可 能 想 锁 仁 胡 ， 保 护 表 的 访问 ， 防 止 其 他 线 
程 读 取 表 ， 对 于 多 线程 代码 ， 这 种 锁 总 是 必要 的 。 

数 摔 结 构 动态 增长 的 务 -- 种 方法 是 使 用 链 太 ， 介 链表 不 能 进行 随机 访问 。 你 只 能 线性 地 
沪 问 链表 【路 非 你 把 频繁 访问 的 链表 元 素 的 地 址 保 在 仁 缓 冲 区 内 ?， 而 数组 则 允许 随机 访问 ， 
这 可 能 在 性 能 上 造成 很 大 的 差别 。 


10.8 ”轻松 -一下 一 -程序 检验 的 限制 
工程 师 所 背 在 的 问题 是 他 们 采取 欺骗 手段 以 获得 结果 ， 


数学 家 所 存在 的 问题 是 他 们 研究 一 些 玩具 性 的 问题 以 获得 结果 . 
程序 检验 员 所 存在 的 问题 是 他 们 在 玩具 性 的 问题 上 采取 欺骗 手段 以 获得 结果 。 





府 名 人 十 


自 日 的 某 一 天 ，Usenet 网 络 的 C 语音 论 坛 上 出 现 了 一 篇 言 苹 尖锐 的 贴 子 ， 使 读者 们 
颇 感 尺 言 。 发 贴 者 《为 侏 护 隐 私 ， 姓名 从 路 〉 要求 在 程序 中 普遍 采用 正式 的 程序 检验 ， 央 
为 “如 果 不 这 样 做 ， 程 序 只 是.- 种 黑客 的 作品 器 了 ”。 他 的 论据 包括 在 一 个 3 行 的 C 程序 
小 加 入 45 行 的 检验 ， 以 维护 程序 的 正确 性 。 为 了 简短 起 见 ， 我 对 这 个 帖子 作 了 讨 缩 ， 赴 
面 是 它 的 内 容 。 

表 10-3 程序 检验 的 帖子 

来 源 : … 位 程序 检验 的 支持 者 

日 期 ，1991 年 5 月 15 日， 星期 开 ， 美 国 太平 洋 时 间 12: 43，52。 

主题; Re: 不 使 用 临时 变量 交换 两 个 值 。 
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续 表 
有 人 问 我 下 向 的 程序 段 : 币 于 交换 两 个 值 》 能 否 达 到 日 的 ; 
*a “= *b;  ”/* 执行 3 个 连续 的 异 或 操作 */ 


*h A 太 己 ， 
*a ^= *b; 
我 的 回答 如 下 : 


在 满 是 下 向 两 种 标准 的 前 :是 下 (1) 这 儿 个 操作 部 是 原子 操作 ;G2 认 在 执行 时 不 会 发 生 健 件 失 败 、 内 
存 空间 不 够 或 数学 运算 失败 。 决 行 下 库 这 个 序列 
ta “= ~vDD xD ^ 人 = #as *a 人 ^= ADb; 


之 后 ，*a 和 *b 的 值 将 十 包 (j 和 和 全 (b)。 其 中 ; 


f3 = lambda x.'x == a ? ft2la}) ~ fiib} : f2ix): 
f2 = lambda x.ix == b ? fl1{b) ^ fita) : fl1 {x); 
f] = lambda x.ix == a? *a * xb : *x) 


或 几 一 种 可 读 性 更 好 的 形 冻 表示 ; 


ffa) = f21t2) > f2{b), f3tx) - f2(x) elise 
£f2(b} = filik}y ~ flia), f2{x) = fi(xX) else 
filta) = *a * *b, fl1l{(x) = *x else 


(前 提 是 *a 和 ib 已 经 定义 ， 也 就 是 ai=NULL，b = NULL)， 


这 样 一 来 ， 这 段 代 合 具 会 产生 两 种 结果 《〈 源 十 beta reduction)， 即 ， 
在 果 a 和 hb 相同 ，f3( = 雪 (by=0 
是 果 a 和 b 不 f3(:) = b, f(b) = a。 


相关 的 可 靠 性 验证 和 调试 :; 
数学 检验 和 验证 是 惟一 可 村 的 技巧 . 舍 则 的 活 程序 就 是 工程 黑客 的 作品 喷 了 .与 从 们 通常 朴 象 的 相反 ， 
所 有 的 C 程序 都 容易 根据 这 种 六 法 通过 数学 分 析 来 进行 驾 驱 。 


电 尺 的 读者 对 于 几 分钟 之 后 的 该 作者 的 跟 帖 更 感 惊 订 .… 


表 10-4 对 程序 检验 帖 的 跟 贴 
来 源 : 一 位 程序 检验 的 支持 者 

日 期 4991 年 5 月 15 日， 组 期 妨 , 美国 太 半 洋 时 间 13:07:34 
主题 : Re: 不 使 用 临 肿 变 量 交换 两 个 值 。 
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我 先前 所 写 的 : 
这 样 来， 这 段 代 个 只 会 证 牛山 种 结果 ( 源 于 beta 缩减》 
也 就 是 ， 

如 果 a 和 hb 相同: 13(4)=f3(b)=0 

如果 a 逢 bb 不 由; (G3) = b,f3(b) = a。 
实际 上 应 该 是 ， 

f3(a) = *b, Nf£3(b) = ta... 


不 仅 这 个 检验 存在 两 个 错误 ， 向 且 他 所 “检验 ”的 C 程序 事实 上 也 不 正确 ! 大 家 部 知道 
仕 C 语 诗 中 不 可 能 不 使 用 临时 变量 来 交换 两 个 值 《 在 - - 般 情况 下 )。 存 此 例 中 ， 如 果 a 和 
指向 午 苔 的 对 象 ， 这 个 算法 就 会 失败 。 另 外 ， 如 果 其 中 :个 变量 存储 于 寄存 器 中 或 者 是 一 个 
位 段 ， 这 个 算法 也 不 可 行 ， 因 为 无 法 取得 寄存 器 或 者 位 段 的 地 址 . 如 果 *a 和 *b 是 长 度 不 同 的 
类 型 ， 或 者 它们 其 中 之 --- 指 向 一 个 数组 ， 该 算法 同样 不 行 。 

可 能 还 有 人 并 不 信服 ， 仍 然 认为 在 程序 之 初 加 入 检验 是 可 行 的 。 下面 这 个 抄录 的 龙 一 个 
典型 的 单 检验 clause， 取 自 一 个 实际 的 程序 ， 它 被 认为 是 正确 的 。 这 个 clause 取 有 自 一 个 傅 立 
叶 变 换 (一 种 聪明 的 信和 号 波形 分 析 ) 的 检验 中 ， 它 出 现 于 1973 年 的 :篇 报道 中 ,“On 
Programming,” 作 者 是 纽约 大 学 Courant 学 院 的 Jacob Schwartz。 

如 果 发 现 还 是 有 人 认为 在 程序 中 提供 检验 是 可 行 的 ， 就 用 下 面 这 个 问题 考 考 他 。 我 们 对 
这 个 检验 从 进行 了 一 个 改动 , 请 找 划 这 处 改动 。 根据 那 中 出 现 的 信息 找到 这 个 修 蕊 是 叮 能 
答案 位 于 本 章 的 末尾 。 


emma tar et ett rare wt ep et A A wer rere re de fee ehh A A mad 


一 个 取 自 快速 傅立叶 弯 换 程序 的 单 检验 条 件 


程序 员 健 康 警 告 ， 千 万 不 要 过 于 投入 ! 

我 列 出 这 个 息 怖 的 程序 检验 的 目的 是 让 你 确信 程序 检验 是 不 可 行 的 ! 

你 愿 不 愿意 整 天 注视 这 儿 页 的 代码 ?很 有 可 能 在 仅 仪 引入 这 些 条 件 时 就 引入 错误 。 连 完 
整 的 检验 本身 写 起 来 都 不 能 确保 是 正确 的 ， 更 何况 要 让 它 检 验 程序 的 完整 性 、… : 致 性 和 正确 
性 ， 

有 些 人 建议 ， 如 果 有 自动 程序 校对 器 ， 这 个 复杂 的 概念 也 可 以 操纵 ， 但 怎么 能 够 确信 一 
个 自动 程序 校对 器 就 不 存在 Bug? 难道 让 校对 器 对 其 白 身 进行 校对 ? 有 一 个 问题 可 以 很 清楚 
她 说 明 校 对 器 是 不 够 充分 的 。 如 果 你 问 一 个 可 能 的 说 谎 者 :“ 你 会 说 度 蚂 ? ”即使 他 问答 说 
“不 ”你 难道 能 够 相信 贻 ? 
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更 多 阅读 材料 


站 想 知 道 哆 多 有 关 程 六 检验 的 问题 ， 有 箱 广 蔓 非 常 值得 该 。 和 区 的 题目 是 Svcial 
Processed and Proofs of Theorems and Prograrms， 刊 千 于 Communications of the ACM， 第 22 
卷 ， 第 5 写 ，1979 年 5 月， 作者 Richard de Millo, Richard Lipton 利 Alan Perlis。 这 提供 了 
为 会 么 现在 程序 检验 尚 不 可 行 的 背景 ， 届 以 预测 它 在 将 米 也 不 可 行 。 程 序 检验 昌江 有明 的 证 
要 观点 就 是 当前 程序 校对 的 处 理 并 不 是- -种 实用 的 建议 。 哪 ! 现在 我 们 只 能 沉 涵 王 “ 工程 
也 客 ” 了 ， 


PN NN A A 


解决 方案 








程序 检验 修改 的 答案 
OK! 我 承认 ， 我 并 没有 在 检验 中 修改 任何 东西 。 但 仔细 阅读 了 这 段 复 杂文 本 的 人 有 没有 


er 
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I 





= 
你 懂得 C， 所 以 C++ 不 在 话 下 
C++ 之 于 C， 就 像 Algol-68! 之 于 Algol， 
一 一 DaviC LJjones 


如 果 你 觉得 C++ 还 不 够 复杂 ， 那 你 知道 protected abstract virtual base pure virtual private 
destructor 是 什么 意思 吗 ? 你 上 次 用 到 它 又 是 什么 时 候 呢 ? 





Tom Cargill, C++ Journal,1990 芒 姨 


ii.1 初 识 OOP 


你 懂得 C， 所 以 C+-- 不 在 话 下 ， 是 吗 ? 也 许 如 此 。 大 部 分 C++ 书籍 都 有 三 四 百 页 厚 ， 排 
版 密密麻麻 。 你 如 果 沉 沽 于 它 的 细节 之 中 , 很 容易 迷失 方向 ， 无 法 从 中 寻找 到 它 的 真正 要 中 。 
丸 ”- 方 而 ， 从 实用 的 角度 讲 ，C++ 是 ANSIC 的 一 个 超 集 ， 它 基本 上 兼容 ANSIC。 不 过 C 话 
二 的 有 些 特性 在 C++ 中 共 不 支持 , 本 章 的 最 后 有 - 张 表 , 列 出 了 这 些 特性 。 但 是 , 要 想 从 C++ 
中 获 益 ， 或 甚至 完全 理解 它 ， 必 须 理 解 一 些 基 础 概念 。 这 就 是 人 们 谈论 使 用 C++ 编程 时 
“object-oriented paradigm《〈 面 向 对 象 编程 模型 )” 和 “转换 思维 ”的 意思 。 我 去 掉 了 C++ 中 的 
一 些 神秘 之 处 ， 尽 量 用 平实 的 语言 来 描述 C+-H， 把 它 与 你 所 熟悉 的 C 语言 特性 联系 起 来 ， 帮 
助 你 尽快 入 门 。 

这 有 点 类 似 于 窗口 接口 编程 模型 。 有 时 我 们 需要 从 窗口 系统 的 角度 ， 学 习 改 写 自 己 的 程 
序 ， 此 时 的 控制 逻辑 就 要 转变 成 主 窗口 循环 处 理 。OOP 也 差不多 ,但 它 是 从 改写 数据 类 型 的 


! Algol-68 是 -种 庞大 的 语言 ， 它 基于 一 种 小 巧 而 有 效 的 语言 Algol-60。Algol-68 难以 理解 ， 难 以 实现 ， 难 以 使 用 ， 划 几乎 每 个 
人 都 认为 它 “ 非 常 强 大 ”。Atgof68 取代 了 Algol-60， 成 功 地 使 后 者 销声匿迹 。 但 由 于 其 使 用 不 便 ，Algol68 也 很 快 退 出 了 历史 
舞 谷 。 有 些 人 觉得 C 和 C++ 的 关系 颇 像 两 个 Algo] 之 间 的 关系 。 
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角度 对 程序 进行 改写 。 

面 冉 对 请 编程 (QOP) 并 :不 是 个 新 鲜 想 法 ，Simula67 总 这 个 概念 的 先 继 ， 迄 今 已 超过 岂 
分 之 -个 世纪 了 了。 面向 对 象 编程 很 自然 地 把 使 大 对 象 作为 程序 设计 的 小心 主题 ， 软 件 对 象 的 
定义 有 很 多 种 ， 其 中 绝 大 多 数 定义 都 同 意 咖 辣 对 象 的 关键 就 威 把 一 些 数据 和 对 这 些 数据 进行 
操作 的 代码 组 会 在 起 ， 并 用 基 种 时 里 手法 将 它们 做 成 -个 单元 。 许 多 编程 兄 语 把 这 种 类 耐 
的 单元 称 为 “class( 类 )” 关于 面向 对 象 编程 的 廉价 定义 也 有 很 多 , 通常 只 有 在 你 理解 了 OOP 
是 什么 以 后 才能 对 这 些 定义 品 头 论 趾 。 共 中 - -种 定义 如 下 : 

面向 对 兹 编程 的 特点 是 继承 和 动态 弓 定 。 C++ 通过 类 的 派生 支持 继承 ， 通 过 虚拟 函数 支 
持 动态 缚 定 。 虚 拟 函 数 提 供 了 一 种 封装 类 体系 实现 细节 的 方法 。 

嘿 ， 看 明白 了 玛 ? 我 将 带领 大 家 进行 :次 C++ 前 轻松 之 旅 ， 只 讲述 那些 需 些 高 度 各 视 的 
东西 。 我 们 将 省 掉 很 多 不 太 重 要 的 细节 ， 这 样 ， 理 解 C++ 语言 框架 的 什 务 使 大 大 减轻 。 我 们 
的 方法 是 领会 一 些 OOP 的 关键 概念 ， 并 总 结 C++ 的 相关 特性 是 如 何 过 持 它们 的 。 这 里 提 到 
的 概念 是 按照 逻辑 顺序 依次 出 现 的 , 后面 出 现 的 概念 一 般 都 建立 在 前 而 出 更 的 概念 的 某 础 上 。 
有 些 编程 洋 例 有 意 与 日 常生 活 行 为 相关 联 ， 如 挤 橙 汁 。 当 然 挤 楼 汗 一 般 并 不 是 通过 软件 方法 
米 实现 的 。 这 里 ， 我 们 将 调转 陌 数 来 进行 这 个 操作 ， 把 焦点 集中 于 抽象 概念 而 不 是 底层 实现 
细节 中 。 首 先 ， 让 我 们 总 结 一 些 术 语 ， 并 使 用 在 C 语言 中 心经 熟悉 的 概念 及 描述 它们 ( 见 表 
11-1)。 

表 11-1 面向 对 象 编程 的 关键 概念 

定 义 
它 是 一 个 去 除 灶 象 中 不 重要 的 细节 的 过 程 ， 只 有 有 那些 撒 述 了 对 象 的 木质 特征 的 关键 
点 才 被 保 署 。 抽 象 是 一 种 设计 活动 ， 其 他 的 概念 都 是 提供 抽象 的 OOP 特性 
类 是 一 种 用 户 定义 类 型 ， 就 好 像 是 int 这 样 的 内 置 类 型 -- 样 。 内 置 类 型 已 经 有 了 -- 
讲 完 善 的 针对 它 的 操作 《如 算术 运算 等 ) ， 类 机 制 也 必须 允许 程序 员 规 定 他 所 定义 
的 类 能 够 进行 的 操作 。 类 里 和 面 的 任何 东西 被 称 为 类 的 成 员 
某 个 类 前 --- 个 特定 变量 ， 就 像 j 可 能 是 int 类 型 的 一 个 变量 一 样 . 对 象 也 可 以 被 称 作 
类 的 实例 (instance) 
把 类 型 、 煞 据 和 函数 组 合 在 一 起 ， 组 成 一 个 类 。 在 C 语言 中 ， 头 文件 就 是 一 个 非常 
脆 台 的 封装 实例 。 它 之 所 以 是 一 个 微不足道 的 封装 例子 ， 是 因为 它 的 组 合 形 式 是 纯 
词法 意义 上 的 ， 编 译 器 并 不 知道 头 文件 是 一 个 语 尽 单位 
这 是 一 个 很 大 的 概念 一 一 允许 类 从 一 个 更 简单 的 其 类 中 接收 数据 结构 和 函数 ， 派 后 
类 获得 基 尖 的 数据 和 操作 ， 并 可 以 根据 需要 对 它们 进行 收 写 ， 也 可 以 帮派 后 类 中 增 
加 新 的 数据 和 上 水 数 成 员 。 在 C 语音 里 不 存在 继承 的 概念 ， 没 有 任何 东西 二 以 模拟 这 
个 特性 


抽象 (abstraction) 


尖 (class) 


对 每 (object) 


封装 (encapsulation) 


继承 (inheritance) 
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1985 年 以 前 ，C++ 的 名 学 是 “C with Classes”， 们 现 厅 人们 局 经 在 其 中 加 入 了 非常 非常 多 
的 特性 ， 从 六 时 的 角度 看 ,“C with Classes ”起 C 语 译 的 一 个 相当 合理 的 扩展 ， 很 容易 解释 、 
实 碾 和 教学 。 敌 即 ， 大 们 对 这 门 语言 投入 了 极 大 的 热情 ， 全 今 本 兽 搬 减 。 右 许多 特性 被 如 入 
到 C++ 中 (有 嵌 房 洗 水 楼 之 称 )。 为 了 制 于 这 种 趋势 ， 和 兽 有 人 建议 CH “在 增加 特性 方向 应 
该 保守 ”， 也 就 是 在 C++ 中 增加 新 特性 应 该 服从 等 比 增 长 规则 。 你 想 增 如 多 和 昔 继 承 吗 ? 可 以 ! 
不 过 踢 常 和 模板 就 只 能 割爱 了! 

坝 在 的 C++ 是 “个 相当 庞 人 的 语言 。 具 体 地 说 ，- 个 C 编 详 器 的 前 端 大 约 有 40,000 行 代 
和 左右 ， 而 一 个 C++ 编 详 器 的 前 端的 代 妈 可 能 是 它 的 两 倍 ， 甚 至 更 多 。 


11.2 抽象 一 一 取 事 物 的 本 质 特性 


人 向 各 对 象 编程 从 面向 对 象 设计 开始 ， 而 面向 对 象 设计 从 抽象 于 始 ， 
什么 是 “对 象 ”? 请 使 用 我 们 新 发 现 的 技 芒 “ 抽 象 ”， 考 虑 一 下 现实 世界 事物 的 相似 之 
处 ， 如 一 畏 小 汽车 和 一 个 软件 。 它 们 的 共同 特 件 列 于 表 11-2。 


“PAA EIS et ett tt mE AA ee rr EN EE ATE VI A FW A A RE TN A ne von 


软件 信条 


WT mt ENN ve TENI a AEE EA TEs RA NV eA AE LNW ee BA er hf pr NNT A RA Tr vv 


关键 概念 : 抽象 


抽象 的 概念 就 是 观察 一 群 “ 事 物 ”( 如 汽车 、 发 票 或 正在 执行 的 计算 机 程序 ) ， 并 认识 
到 它们 具有 一 些 共同 的 主题 ， 你 可 以 忽略 不 重要 的 区 别 ， 只 记录 能 表现 事物 特征 的 关键 数据 
项 ( 如 许可 证 号 码 、 预 定数 量 或 地 址 空间 边界 等 ) 。 当 你 这 样 做 的 时 候 , 就 是 在 进行 “抽查 ”. 
所 存储 的 数据 类 型 就 是 “抽象 数据 类 型 ” 。 抽 象 听 上 去 像 是 一 个 艰深 的 数学 概念 ， 但 不 要 被 
它 糊 弄 一 一 它 只 不 过 是 对 事物 的 简化 而 已， 


TN TT TR ee ep ROE eb he ee EWE PS AN A fe te ED a 





表 11-2 抽象 实例 






软件 实例 ， 排 序 程序 
整个 事物 具有 一 个 名 字 
定义 良好 的 输入 和 输出 





输入 ; … 个 水 排序 的 文件 
输出 ;一 个 已 排序 的 文件 





输入 ; 燃料 和 汽油 
输出 : 交通 运输 










发 动机 、 持 感 器 、 泵 等 





由 更 小 的 自 包含 的 对 象 组 成 由 、 头 文件 、 苹 数 、 数 据 结构 
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续 表 
汽车 实例 对 和 象 特征 软件 实例 ， 排 序 程序 
世界 上 存在 很 多 汽车 ， 有 许多 | 可 有 很 多 的 实例 对 象 它 的 实现 应 沪 多 许 儿 个 用 户 同时 
不 同 的 品种 排序 ， 例 如 不 需要 依赖 -个 全 局 

的 临时 工作 空间 
顽 料 守 并 不 依赖 间 影 响 挡 车 ， 更 小 的 自 包含 的 对 象 无 相互 作用 ， 除 | 用 十 读 取 记 东 的 程序 应 该 与 关键 
板 清洗 器 _ 非 它 是 通过 定义 良好 的 接口 进行 的 比较 程序 独立 
计时 器 的 计时 变化 并 不 是 驾 “不 能 直接 操纵 或 甚至 看 到 实现 细节 ”| 用 户 应 该 并 不 需要 知道 或 进步 
车 者 的 任务 ， 所 以 驾驶 员 不 能 利用 程序 所 此 用 的 特定 的 排序 算 
直接 控制 计时 器 对 其 进行 修 法 {如 快速 排序 、 坎 排序 、Shel1l 
改 排序 等 ) 


可 以 定 换 一 个 蝎 好 的 发 动机 ， ”可 以 在 不 修改 用 户 接口 的 情况 下 修 | 实现 者 应 该 能 够 件 不 影响 用 户 使 
和 无须 更 改 部 驶 员 的 操作 方 ” 改 实现 几 的 前 提 下 普 换 -- 种 更 好 的 排序 
法 算法 


注意 : 在 软件 的 属性 里 ， 有 许多 以 “应 该 ”的 形式 出 现 。OOP 诉 襄 如 C++ 提供 了 一 些 特 
性 ， 把 上 面 的 这 些 “ 感 望 ” 变 成 了 “现实 ”在 软件 中 ， 抽 象 是 非常 有 出 的 ， 因 为 它 允 许 程序 
员 实 现下 列 日 标 : 

*。 隐藏 不 相关 的 细 节 ， 拒 注意 为 集中 在 本 质 特征 上 。 

， 向 外 部 世界 提供 一 个 “ 黑 盒 子 ” 接口 。 接口 确 定 了 施加 在 对 象 之 上 的 有 效 操作 的 集合 ， 
但 它 并 不 提示 对 象 在 内 部 是 繁 样 实现 它们 的 。 

”把 一 个 复杂 的 系统 分 解 成 用 个 相互 独立 的 组 成 部 分 。 这 可 以 做 到 分 上 明确 ,避免 组 件 
之 间 不 符合 规则 的 相 瑟 作用 ， 

， 重用 和 共享 代码 。 

C 语言 通过 允许 用 户 定义 新 的 类 型 (struct、enum) 来 支持 抽象 ， 用 户 定 义 类 型 几乎 和 预定 
义 类 型 (int、char 等 ) 一 样 方 便 ， 使 用 形式 也 几乎 一 样 。 我 们 说 “几乎 一 样 方便 ”起 因为 C 
语言 并 不 允许 在 用 户 定义 类 型 中 重新 定义 *、<<、[]、+ 等 预定 义 操作 符 。C++ 则 消除 了 这 个 
障碍 。C++ 同 时 提供 白 动 和 受 控 制 的 初始 化 、 数 据 在 生命 期 结束 后 自动 清除 以 及 隐 式 类 型 转 
换 。 这 些 特 性 有 些 是 C 诸 言 所 不 支持 的 ， 有 些 在 C 语言 时 不 是 很 方便 。 

抽象 建立 了 一 种 抽象 数 问 类 型 ，C++ 使 用 类 (class) 这 个 特性 来 实现 它 。 它 提供 了 一 种 自 上 
而 下 的 、 观 察 数据 类 型 属性 的 方法 来 看 待 封装 ， 把 用 户 定义 类 型 中 的 各 种 数据 和 方法 组 合 在 
一 起 。 它 同时 也 提供 了 一 种 目 底 向 上 的 观点 来 看 待 封装 ;把 各 种 数据 和 方法 组 合 在 一 起 实现 
一 种 用 户 定义 类 型 。 
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11.3 ”封装 一 一 把 相关 的 状 型 、 数 据 和 图 数组 合 在 -一 起 


当 你 把 抽象 数据 类 型 和 它们 的 操作 托 绕 在 一 起 的 时 候 ， 斌 是 在 进行 “封装 ”。 韭 OOP 语 
言 没 有 完备 的 机 制 来 实现 封装 。 我 们 没有 办 法 告诉 C 编译 器 “这 3 个 隐 数 只 对 这 个 特定 的 结 
构 芝 型 才 有 效 ” 也 没有 办 法 防止 程序 定义 一 个 新 的 明 数 ,以 大 经 检 霄 的 和 不 签 的 方式 访问 
这 个 结构 ， 


Tn 


软件 信条 


AA TI RN a a 


关键 概念 一 一 类 把 代码 和 相关 的 数据 封装 〔 捆 绑 ) 在 一 起 。 


在 程序 设计 演化 的 最 初 阶段 , 汇编 程序 只 能 在 位 和 字 上 进行 操作 , 随 着 高 级 语言 的 出 现 ， 
程序 员 可 以 很 容易 地 访问 各 种 日 益 增 长 的 硬件 操作 数 : float, double, Iong, char 等 。 有 些 高 
级 语言 使 用 了 强 类 型 ， 确 保 只 有 在 某 种 类 型 的 变量 上 才能 有 效 地 进行 茉 种 类 型 的 操作 。 这 是 
类 的 启蒙 形式 ， 因 为 它 把 数据 项 和 本能 施加 在 它们 上 面 的 操作 固定 在 一 起 。 这 些 操作 通常 对 
应 每 条 单独 的 硬件 指令 上 ， 如 “ 浮 点 数 乘法 ”， 

随 着 程序 设计 语言 的 讲 一 步 发 展 ， 它 们 允许 程序 员 将 各 种 数据 类 型 组 合 在 一 起 形成 用 户 
定义 的 记录 【在 人 《语言 中 是 结构 ) ,但 没有 办 法 对 沪 歼 进行 限制 ， 司 它们 不 能 讨 心 所 馈 地 操 
作 数 据 以 及 对 用 户 定义 类 型 的 私有 字段 进行 访问 。 如 果 一 个 结构 是 完全 可 见 的 ， 它 的 任何 部 
分 部 可 能 以 任何 方式 被 修改 。 人 们 无 法 把 函数 固定 到 数据 类 型 上 ， 使 它们 清晰 地 成 为 一 体 . 

组 织 数据 人 


人 Da 
ee 
2 它 就 像 址 个 类 型 
一 一 一 


组 织 代 全 -一 一 
程序 设计 艺术 的 当前 状态 是 面向 对 象 语言 ， 它 们 通过 把 用 户 定义 的 数据 结构 和 用 户 定义 
的 能 够 在 这 些 数据 结构 上 进行 操作 的 阴 数 捆绑 在 一 起 实现 了 数据 的 完整 性 。 别 的 邓 数 无 法 访 
辣 用 户 定义 类 型 的 内 部 数 汤 。 这样 ， 强 类 型 就 从 预 定义 类 型 扩展 到 用 户 定义 类 型 ， 





OO 
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11.4 展示 一 些 类 一 一 用 户 定 义 类 型 富有 和 预定 义 类 型 一 样 的 权限 


C++ 的 类 机 制 实现 了 OOP 的 封装 要 求 ， 类 就 是 甘 装 的 软件 实现 、 类 也 是 一 种 类 型 ， 就 像 
char, int, double 和 struct rec * 部 是 类 型 一 样 , 因 贞 ,你 必须 声明 该 类 的 灾 量 以 便 进行 有 用 的 工 
作 。 类 和 类 型 一 样 ， 可 以 对 它 进 行 很 多 操作 ， 如 取得 它 的 大 小 或 声明 它 的 变量 等 。 

对 象 和 变量 一 样 ， 可 以 对 它 进行 很 多 操作 ， 如 取得 它 的 地 址 、 把 它 作为 参数 传递 、 把 它 
作为 滑 数 的 返回 值 、 使 它 成 为 常 泡 值 等。 一 个 对 象 “ 一 个 类 的 变量 ) 可 以 像 声明 其 他 任何 寞 
昌 - - 样 被 声明 : 

VegetaDbiec carrotl,; 

这 里 ，Vegetable 是 一 个 类 的 名 字 〔 稍 后 详 述 如 何 创 建 一 个 类 本 身 )， 而 carrot 呈 该 类 的 
一 个 对 象 . 类 的 名 字 以 大 写字 母 开 头 是 - -个 很 好 的 习 民 。 

C++ 类 允许 用 户 定义 类 型 ， 

” 失 嵌 户 定义 类 型 和 和 施加 在 它们 上 基 的 操作 组 合 在 一 起 。 

*。 上 有 具有 和 内 置 类 型 一 举 的 特权 和 和 外观。 

。 可 以 用 更 基本 的 类 漠 创 建 史 复杂 的 类 型 ， 


ar a me 





Tae 


关键 概念 一 一 类 


类 就 是 用 户 定 义 类 型 如 上 所 有 对 该 类 型 进行 的 操作 . 

类 经 常 被 实现 的 形式 是 : 一 个 包含 多 个 数据 的 结构 ， 加 上 对 这 些 数据 进行 操作 的 函数 的 
指针 ， 编 译 器 施行 强 类 型 一 一 确保 这 些 吕 数 只 会 被 该 类 的 对 象 调用 ， 而 且 该 类 的 对 象 无 法 调 
用 除 它们 之 外 的 其 他 函数 。 


C++ 的 类 实现 了 上 述 所 有 上 日 的 。 它 可 以 看 作 是 一 个 结构 ， 而 且 它 确实 可 以 方便 地 用 -个 
结构 来 实现 ， 类 通常 的 形式 是 : 


class 类 名 1{ 
访问 控制 :声明 
访问 控制 声明 

}}; 
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11.$ 访问 控制 


访问 控制 是 -个 关键 于 ， 它 说 明了 谁 可 以 访问 接 下 米 声 明 的 数据 或 浮 数 。 访 问 控 制 可 以 
是 下 而 3 神 之 一 : 
pubtic 属于 public 节 声 明 在 类 的 处 部 可 见 ， 并 可 按 需 要 进行 没 管 、 油 几 和 操纵 。 一 般 的 原 划 总 不 
费 把 类 的 数 闫 做 成 public， 因 为 让 数据 保持 私有 才 符 合 面向 对 象 编程 的 理论 之 - -: 只 全 类 
本 身 才 能 改变 自己 的 数据 ， 外 部 函数 具 能 调用 类 的 成 员 函 数 ， 这 就 保证 了 类 的 数据 只 会 以 
合乎 规划 的 方式 被 更 新 


protected 属 protected Hf 声明 的 内 容 只 能 由 该 类 本 身 的 滑 数 以 及 从 该 类 所 派生 的 类 的 两 数 全 用、 
private 属于 private 多 声明 只 能 被 该 类 的 成 员 沙 数 使 用 .privyate ;ss 明 在 类 外 部 大 可 出 的 (名字 是 


己 知 前 》， 在 . 却 是 不 能 访问 的 


为 外 还 有 两 个 关键 字 世 会 影响 访问 控制 ， 它 们 起 ffieud 和 virtual。 这 两 个 关键 子 每 次 只 
能 用 于 -条 声明 ， 调 上 述 % 个 关键 字 每 个 后 面 可 以 跟 - -人 串 声明 。 男 外- -点 不 同 的 是 ,friend 
和 virtual 这 两 个 关键 字 后 型 不 跟 冒 号 。 


friend 属于 friend | 的 函数 不 属于 类 的 成 员 汤 数 ， 但 可 以 像 成 员 疯 数 一 样 访问 类 的 private 和 
protected 成 页 。friend 可 以 是 个 函数 ， 志 可 以 是 -个 类 
virtual 到 现任 为 止 我 还 没有 六 益 这 一 十 题 ， 所 以 这 个 放 题 暂时 搁 下 ， 容 后 再 述 


我 向 C++ 标准 化 组 级 提交 了 -个 正式 文档 《文档 号 X3J16/93-0121)， 建 议 所 有 5 个 访问 
控制 关键 宁都 以 “p” 开 头 ， 关 键 字 friend 应 该 改名 为 protégé 《这 向 时 加 以 促进 C++ 的 困 际 
化 ， 并 表达 一 种 关系 的 不 寺 称 性 ，friend 显然 无 法 做 到 这 点)。 关 键 宁 virtual 应 该 时 名 为 
placeholder， 历 描述 性 的 本 说 “pure” 跟 访问 控制 毫 无 关联 ， 所 以 应 该 更 名 为 “empty”。 这 样 
做 可 以 稍微 提高 这 门 语 言 的 词法 规整 性 。 如 果 委 员 会 走 欢 这 个 试验 ， 他 们 上 吕 以 把 它 进 - - 步 护 
展 到 语 吝 更 有 意义 的 语法 领域 。 可 惜 的 症 ， 委 员 会 对 我 的 建议 并 没有 作出 反应 .. 


11.6 ”声明 
C++ 类 的 声明 就 是 正当 的 C 声明 ， 内 容 包括 销 数 、 类 型 〔 包 括 上 其 他 类 ) 或 数据 ， 类 拒 它 


们 托 在 一 起 。 类 中 的 每 个 六 数 声明 都 需要 - -个 实现 ， 它 可 以 在 类 里 面 实现 ， 也 可 以 在 类 外 部 
实现 〈 这 是 通常 的 做 法 )。 这样 ， 类 的 总 体 情况 大 致 如 下 ; 








。 这 并 不 是 我 异想天开 的 建议 : ANSIC 中 命名 不 当 的 const 关键 字 造 成 了 非常 现实 的 问题 。 这 是 个 机 会 ， 订 以 使 C++ 避免 类 似 的 
问题 ， 司 C++ 里 面 这 个 羔 手 的 此 方 保持 竹 性 。 
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class Fruit 1: public; peecl(}); slice ); Jaicet |; 
rivatle: int welight., calorles per_o2; 
}} 
i 1 类 藉 一 个 实例 
Frultl melon; 


记 住 ，C++ 的 注 娠 始 于 W， 育 至 行 尾 。 


编程 挑战 


aN a bd mm aT AAA A EV AAA EN UN Ye re TGR TN OO re 


尝试 编 译 和 运行 一 个 C++ 程序 .. . 


是 时 候 党 试 一 个 CHH 程 序 了 .C++ 源 文件 通常 具有 扩展 名 .cpp 或 ,cc 或 ,c. 请 创建 一 个 这 
祥 的 文件 ， 键 入 上 述 代码 ， 并 增加 一 个 “hello, world” 主 程序 .声明 几 介 Fruit 类 的 对 象 ， 
在 许多 系统 中 ， 通 常用 下 面 的 命令 调用 C++ 编译 器 : 


Ce £7FULt .CHD 





和 CC 相 比 ， 你 必须 显 六 地 用 C++ 编译 器 来 调用 它 ， 编 译 并 运行 aout 文件 。 茶 喜 ! 虽然 
很 简单 ， 但 你 确实 成 功 编写 了 一 个 C+t+ 类 ， 


当成 员 甩 数 在 类 的 外 部 实现 时 ， 前 向 必须 附加 一 些 特别 的 前 缀 ,， 这 个 前 织 就 牙 :: ， 它 仿 
佛 在 大 声呐 喊 “ 嗨 ! 我 很 重要 ! 我 表示 有 些 东 西 属于 一 个 类 ”。 反 之 ， 看 一 下 正常 的 C 丧 数 
占 明 ， 
返回 值 函数 名 (参数 列表 ) { /i* 实现 */ 1] 
成 员 冰 数 〈 又 名 “方法 ” 的 形式 则 是 : 
返回 值 类 名 :: 函 数 当 【人 参数 列表 ) { /* 实现 */] 
:被 称 为 “全 局 范围 分 解 符 ”。 跟 在 它 前 南 的 标识 符 就 是 进行 查找 的 范围 。 如 呆 :: 前 而 没 
有 有 标识 符 ， 就 表示 查找 范围 为 企 局 范围 。 如 果 peelO0 成 员 出 数 的 实现 龙 在 类 的 内 部 ， 它 的 形 
式 大 致 如 下 ; 
class Fruit { public: void peel(}) { prinLttin peei" 1 } 
slicel); 
juice'}); 
private: int weight, caljories.per_o2z; 
3 
如 果 它 的 实现 古 在 类 的 外 部 ， 其 形式 大 致 如 下 : 
class Fruit { public: woid peel1l : 


slicel}: 
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juice{); 
private: int weight, calories_per_o2; 
Ft 


vold Fruit::peel{l}) : printft"in peel'); } 

这 两 种 方法 在 语义 上 是 等 价 的 ， 但 第 一 种 形式 此 为 常见 ， 它 的 好 处 是 可 以 通过 使 用 头 广 
件 ， 使 源 代 码 的 组 织 形式 更 为 清晰 。 第 -- 种 形式 通常 用 于 非常 简短 的 函数 ， 它 的 代 但 在 编译 
时 在 声明 处 自动 展开 ， 这 样 在 运行 时 就 不 必 付出 函数 调用 的 代价 。 出 于 它 会 使 编译 后 的 代 人 的 
变 长 ， 所 以 只 适用 十 非常 简短 的 函数 ， 





编写 成 员 范 数 体 


为 Fruit 类 的 stice0 和 jniceO 成 员 通 数 编写 函数 体 . 你 可 以 从 拷贝 peel 的 函数 体 开 始 做 起 . 

1. 在 现实 的 系统 中 , 这 些 成 员 部 数 可 能 需要 操纵 机 器 人 的 手 峭 来 完成 所 需 的 对 水 果 的 操 
作 。 但 作为 练习 ， 我 们 简单 地 使 每 个 成 员 函 数 打 印 一 条 消息 ， 显 示 它 们 已 被 调用 。 

2. 给 予 这 些 函 数 适 当 的 参数 和 返回 类 型 。 例 如 ，slice() 函 数 应 该 接受 一 个 整 型 参数 ， 表 
示 需 要 切片 的 数量 。juice0 泥 数 应 该 返回 一 个 浮 点 值 ， 表 示 所 获得 的 果汁 量 (以 毫升 计 ) 等 . 
自然 ， 类 定义 中 成 员 通 数 声明 的 原型 应 当 与 它们 定义 时 的 形式 相 匹配 。 试 试 访问 类 中 private 
部 分 的 数据 成 员 ， 首 先 从 扎 员 函数 内 部 访问 它们 ， 然 后 从 类 的 外 部 访问 它们 ， 看 看 有 什么 结 
果 , 





11.7 如何 调用 成 员 轩 数 


让 我 们 看 -~ 下 放 用 类 的 成 员 函 数 的 有 趣 方 法 。 你 必须 在 需要 调用 的 成 员 消 数 前 面 附 上 类 
的 实例 名 《或 称 类 的 变量 ， 也 就 是 对 象 ) 
Fruit melon, orange, banana; 
maint) f{ 
melon.slicet{}); 
Orange ,juic:e ly 


return 0O; 
} 


必须 如 此 ， 这 些 成 员 函 数 才 能 被 调用 ,执行 各 自 的 任务 。 这 有 点 像 - - 些 骇 定义 的 操作 符 ， 
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当 我 们 书写 i++ 时 ， 监 到达 的 意思 是 “ 取 i 对 象 ， 对 它 执行 后 线形 式 的 站 增 操作 ”， 调 用 一 
个 类 的 对 象 的 成 员 丙 数 相 % 于 面向 对 象 编程 诸 言 所 使 用 的 “ 癌 对 象 发 送 一 条 信息 "这 个 术 谢 。 
每 个 成 员 示 数 帮 有 -个 this 指针 参 数 ， 它 是 隐 式 赋 给 该 场 数 的 ， 它 允许 对 象 在 成 员 蝴 数 
内 部 引用 对 象 本 午 。 注 意 ， 作 成 员 函 数 内 部 ， 你 应 该 发 现 this 指针 并 未 亚 式 册 现 ， 这 也 是 读 
言 本 身 所 设计 的 。 
Class Fruit { public: voiqd peclt{}, 


Erivate: int weidght, calories. per_o2:; 


}} 


void Fruit:;peel (y { wrintFlthis prr = $$p'", Lhis}); 
this->weight-—; 
welght--;} 


Fruit appie; 
printfi"address cf apple=%x", &apple}; 


apple.peel[);} 


BT /vv -vv 一 





编程 挑战 
调用 成 员 函 数 

1. 调用 在 前 面 的 例子 中 所 编写 的 slice0 和 juice(0) 成 , 员 也 数 ， 

2, 试验 一 下 this 指针 驴 否 隐 各 传 递 给 每 个 成 员 遂 数 的 第 一 个 参数 ， 


me 


构造 函数 和 析 构 阔 数 

绝 大 多 数 类 至 少 具有 一 个 构造 函数 。 当 类 的 一 个 对 象 被 创建 时 , 构造 函数 被 隐 式 地 调用 ， 
蕊 负责 对 象 的 初始 化 。 与 之 相对 应 ， 类 也 存在 一 个 清理 函数 ， 称 为 析 构 函数 。 当 对 象 被 销毁 
(超出 其 生存 范围 或 进行 delete 抬 作 ， 回 收 它 所 使 用 的 堆 内 存 ) 时 ， 术 构 冰 数 被 自动 油 用 。 析 
构 阔 数 不 如 构造 函数 常用 , 汪 里 面 的 代码 一 般 用 于 处 理 - 些 特殊 的 终止 票 求 以 及 垃圾 收集 等 。 
有 此 人 把 析 构 圾 数 当 作 一 科 保 险 方法 来 确保 当 对 象 离开 适当 的 范围 时 , 辣 步 锁 总 能 够 被 释放 。 
所 以 他 们 不 仅 清除 对 象 ， 还 清理 对 象 所 持 有 的 锁 。 构 造 丽 数 和 析 构 钢 数 是 非常 青 要 的 ， 内 为 
头 外 部 的 任何 函数 都 不 能 访问 类 的 private 数据 成 员 。 央 此 ,你 需要 类 内 部 有 一 个 特权 晴 数 来 
创建 一 个 对 象 并 对 其 进行 初始 化 。 

相对 于 C 语言 而 言 ， 这 大 一 个 小 小 的 飞跃 。 在 C 语言 中 ， 只 能 使 用 赋值 符号 在 变量 定义 
时 对 它 进行 初始 化 ， 或 干脆 使 它 保持 未 初始 化 状态 。 可 以 在 C++ 的 类 中 声明 多 个 构造 函数 ， 
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道 过 参数 来 区 分 它们 。 构 造 廊 数 的 名 字 总 是 和 类 的 名 字 一 样 : 
Classriame :1 Classname largumerntLs) {...};} 
以 Fmit 类 为 例 ; 
class Fruit { public: peel{); slice{}; ulcer 
Frvuit (jrt >，inb j); /构造 函数 
--Fruit(),; 1f 析 构 浮 数 


private: int weitht, calories per_oz} 
二 


/7 构造 图 数 体 


Frulit::Fruit{int i, int j}iweight = i; calories_per oz = j;} 


/17 对象 声明 时 由 构造 函数 进行 初始 化 


Fruit meion(l4, 5)}, barana{l2, 8}} 


构造 前 数 是 必要 的 ， 因 为 类 通常 包含 一 些 结构 ， 而 结构 又 可 能 包含 许多 字段 。 这 就 需要 
休 的 初始 化 。 当 类 的 一 个 对 象 被 创建 时 ， 构 造 阴 数 会 被 自动 亩 用， 程序 员 水 远 不 应 该 显 式 
地 调用 构造 因数 ， 至 于 全 局 和 静态 对 象 ， 它 们 的 构造 抽 数 会 在 程序 开始 时 被 自动 调用 ， 厕 当 
程序 终止 时 ， 它 们 的 析 构 函数 会 被 自动 调用 。 

的 运 昂 数 和 析 构 闪 数 违 区 了 C 语言 中 “一 切 工 作 自 己 负责 ”的 原则 。 它 们 可 以 使 大 旦 的 
工作 住 程序 运行 时 被 聊 式 也 完成 ， 减 轻 程序 员 的 负担 ， 这 也 违背 了 C 语言 的 哲学 ， 也 就 是 庄 


二 中 的 任何 部 分 都 不 应 该 通过 隐藏 的 运行 时 程序 来 实现 。 





编程 挑战 


做 一 些 清除 工作 


为 Fmit 类 的 灯 构 函数 编写 函数 体 ， 里 而 包含 一 条 printt0) 语 加， 并 在 一 个 内 层 的 域 中 声 
明 一 个 Fmit 类 的 对 象 。 需 要 在 程序 的 头 部 添加 机 nclude<stdio.h> 语 铅 。 然 后 ， 重 新 编译 和 运 
行 aout 文件 ， 看 看 当 对 象 离开 了 它 的 生命 域 时 析 构 函数 是 否 被 调用 ， 


11.8 ”继承 一 一 上 复 用 已 经 定义 的 操作 

当 一 个 类 沿用 或 定制 它 的 惟一 基 类 的 数据 结构 和 成 员 函 数 时 ， 它 就 使 用 了 单 继承 。 这 就 奸 
立 了 一 个 类 体系 ， 类 似 一 种 科学 分 类 法 。 每 … 层 都 是 对 上 一 - 庄 的 细 化 。 类 型 继承 足 OOP 的 精 
华 之 一 ， 这 个 概念 在 C 语言 中 确实 不 存在 。 你 竖 做 好 思想 准备 ， 迎 接 这 个 “概念 上 的 飞跃 
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关键 概念 ， 继承 


从 一 个 类 派生 另外 一 个 类 ， 使 前 者 所 有 的 特征 在 后 者 中 自动 可 用 ， 它 可 以 声明 一 些 类 型 、 
这 此 类 型 可 以 共享 部 分 或 全 部 以 前 所 声明 的 类 型 。 它 也 可 以 从 超过 一 个 的 基 类 型 共享 一 些 特征 。 

继承 通常 在 概念 上 提供 越 米 越 多 的 网 化。 一 般 从 较为 简单 的 基 类 (如 交通 工 具 ) 派生 出 
更 为 只 确 的 派生 类 (如 载 客 小 汽车 、 救 火车 或 运 货车 等 )。 它 既 可 裁 前 也 可 以 增加 可 用 的 操作 。 
shape 类 可 能 是 C++ 文献 由 说 明 继承 这 个 特性 的 流行 例子 。 基 类 是 较为 抽象 的 shape 形状)， 
从 它 可 以 派生 出 许多 更 为 雷 定 的 circle〈 圆 )、square《〈 正 方形 ) 和 pentagon (五 边 形 ) 类 。 我 
觉得 如 果 我 们 一 开始 就 考虑 一个 “类 继承 "的 现实 世界 的 例子 一 一 动物 士 国 的 林 祭 分 类 法 (多 
图 11-1) 会 更 合理 一 些 ， 另外 一 个 类 似 的 例 了 是 C 语言 中 的 类 型 ， 它们 显示 了 继承 与 C 语言 
四 的 类 型 模型 是 如 何 相关 的 。 

动物 十 寺中 的 种 类 
季 索 动物 门 《和 语言 的 类 型 


哺乳 动物 网 两 栖 动物 网 纳 台 类 型 标量 炎 型 


入 区 月 幅 具 入 ee 


~、 


人 科 De 种 数 类 型 实数 迷 型 


数值 类 型 术 举 指 计 


智 人 种 long int char 


图 11-1 继 产 体系 的 两 个 现实 世界 的 例子 
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在 上 而 的 例子 中 ;: 

， 澄 索 动物 门 包括 记 有 具有 次 索 (简单 地 说 ， 就 是 咨 椎 ') 的 动物 ， 也 只 有 具有 痊 索 的 
动物 才 属 于 痛 索 动物 门人 在 动物 上 困 'R 共 有 32 个 门 。 

。 所 有 的 哺乳 动物 具有 - 根 状 检 。 欠 为 它们 派生 于 兰 索 动物 门 ， 所 以 继 丰 了 这 个 特性 ， 
晴 乳 动物 有 它们 独 有 的 特征 :它们 用 乳 计 她 育 后 代 ， 和 它们 的 下 筑 只 有 一 根 骨 头 ， 它 们 共有 毛 
发 ， 它 们 的 内 十 具有 -- 完 的 甘 结构 、 它 们 的 军 此 分 为 凑 代 〈 如 人 类 的 乳牙 和 恒 牙 ) 等 。 

， 员 长 日 动物 继承 了 晴 乳 动物 的 所 有 特征 (包括 哺乳 动物 从 痊 索 动物 继承 而 来 的 次 椎 )， 
它们 也 有 自己 独 共 的 特性 ;长 在 前 面 的 眼睛 ， 有 :个 恒 赤 的 脑 过 ， 有 一 种 特殊 模样 的 门 罕 。 

人 科 继 承 了 继承 了 灵 长 月 种 它们 的 更 远 祖先 的 所 有 特性 。 它们 自身 也 有 一 些 独 有 的 特 
征 ， 包 括 骨 加 上 的 - 些 改 释 以 适合 两 脚 直立 行 直 ， 知 大 《现代 人 的 学 名 )》 种 是 人 科 惟 - - 坝 存 
的 种 类 ， 其 他 属于 人 科 的 -- 些 种 类 均 已 灭绝 。 

对 语调 的 类 型 体系 稍 作 抽象 ， 可 类 似 分 析 如 上 下; 

"CC 店主 中 的 所 有 类 弄 覃 么 是 组 合 类 型 (composite type， 刀 数组 、 结 构 等 ， 它 们 由 相 何 
的 更 小 的 元 素 组 成 )， 要 么 是 标量 类 型 (scaler type)。 标 最 类 型 具有 -- 个 特性 ， 它 的 每 个 值 部 是 
刀子 秆 《并 非 由 其 他 类 型 所 组 成 的 )。 

。 数 侦 类 型 继承 了 标量 类 型 的 所 有 特性 ， 它 们 男 外 增加 了 -个 特性 ， 就 是 它们 记录 算术 
有 

*， 丈 数 类 型 继 相 了 数值 类 型 的 所 有 特性 ， 此 外 它们 还 拥 丰 白 己 的 狂 有 特性 ， 就 是 它们 都 
是 整数 (没有 小 数 部 分 )。 

char 也 属于 整数 类 型 ， 它 的 取 值 范 团 较 小 (一 128~…127)。 

尽管 我 们 可 以 像 上 咖 -- 样 从 理 沦 上 把 继承 应 用 人 钊 所 熟悉 的 已 语 言 类 型 路 而 自得 而 各， 但 
是 ， 我 们 注意 到 ， 这 个 继 系 柑 型 对 于 C 程序 员 来 说 并 没有 实用 价值 。C 语言 并 不 允许 程序 员 
创建 -等 公民 (与 内 办 类 型 则 -级 别 ) 的 新 类 型 ， 继 承 了 共 他 数据 类 型 的 属性 的 数据 类 型 为 
数 极 少 。 所 以 ， 程 序 员 无 法 在 砚 实 的 程序 中 使 用 这 个 类 型 体系 。OOP 的 一 个 重要 部 分 就 是 推 
汤 出 你 的 应 用 程序 中 抽象 数据 类 型 的 体系 结构 。C++ 所 创造 的 、C 语言 无 法 通过 正当 途 笠 轻 
切实 现 的 主要 新 奇 玩 意 儿 就 是 继承 。 继 承 允许 程序 员 使 类 型 体系 结构 显 式 化 ， 并 利用 它们 之 
间 的 关系 来 控制 代码。 

让 我 们 实现 一 个 Aprle (苹果 ) 类 ， 它 具有 Frujt 《水 果 ) 类 的 所有 特征 ， 并 拥有 两 个 自 
身 独 有 的 特征 。 这 两 个 在 苹果 上 可 以 进行 但 在 其 他 类 型 的 水 果 工 不 太 适 合 的 檬 作 吓 : 

。 制作 苹 染 出 。 你 态 法 为 制作 梨 品 ， 因 为 梨 比 苹 生 更 稠密 ， 水 份 也 更 多 。 制 作 苹 果 串 可 
以 通过 成 员 涌 数 bob_for0 来 实现 。 

。 制作 苹果 密 馈 (美国 人 所 说 的 “ 蕴 果 棱 糖 "}。 人 们 并 不 在 萄 菊 上 泌 饮 糖 ， 即 使 在 加 利 
福 尼 亚 州 人 们 也 不 这 祥 上 制作 苹果 害 钱 可 以 通过 成 员 男 数 make_candy_apple0) 来 实现 。 


” 稼 樵 足 容 索 的 -- 种 ， 具 有 痊 椎 第 动物 属于 洽 椎 动物 斑 门 ， 出 荆 准 索 动物 门 中 不 属 丁 短 樵 动物 下 门 的 动物 极为 军 见 ， 所 以 可以 进 
似 地 扎 贿 椎 动物 虹 门 看 成 羡 疮 过 动物 门 。 一 一 译 者 注 
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所以， 我 们 计 苹 果 类 综 承 水 果 类 的 所 有 操作 ， 半 增加 两 个 日 己 特有 的 成 员 孙 数 。 不 要 为 
应 该 怎样 实现 这 些 成 员 盏 数 而 劳 神 。 显 然 ， 它 们 与 寻 芝 的 计算 模型 相去 去 延 。 记 住 ， 我 们 关 
心 的 是 新 概念 ， 不 此 被 那些 独特 的 算法 迷失 方向 。 





rr 一 一 一 一 一 一 一 


C++ 如 何 进行 继承 


继承 在 两 个 类 之 闻 (而 不 是 两 个 肖 数 之 间 ) 进行 . 
基 类 的 例子 如 下 : 


class Fruic 
{ 
public: 
Peel tl ; 
slicel); 
juicel}; 
private: 
int weight, calories, per_oz: 





上 
派生 类 的 例子 如 下 : 
class Apple ; RDOBLic Fruit 
{ 
public: 
VOIG makse._candy_apple'float weight)}); 
void pob_Eorfint tub_jid, irnt number_ocf_attempts); 
}; 


对 象 声 明 的 例子 如 下 : 
Apple 上 eachelS : 





直面 的 例子 表示 派生 类 Apple 是 基 类 Fruit 的 特殊 类 型 。Apple 类 声明 第 一 行 的 public 关 
键 字 确定 了 派生 类 以 外 的 对 象 对 基 类 的 访问 控制 。 这 个 话题 要 是 在 这 里 完全 展开 就 太 估 了 ， 
所 以 我 略 去 不 讲 。 

继承 的 语法 初 看 上 去 令 人 感到 不 太 舒 服 。 派 生 类 的 名 字 后 面 跟 -个 崩 号 ， 然 后 是 其 类 的 
名 字 。 这 种 形式 非常 简洁 ， 它 并 不 提供 太 多 提示 ， 告 诉 我 们 哪个 是 基 类 哪个 是 派生 类 ， 而 日 
它 并 不 传递 任何 跟 类 型 说 明 有 关 的 信息 。 它 并 不 是 建立 在 现 有 的 C 诸 言 惯用 法 的 基础 上 ， 所 
以 传统 经 验 也 帮 不 了 我 们 。 

不 要 把 在 一 个 类 内 部 嵌 依 另 一 个 类 与 秋 承 混淆 。 藤 套 只 是 把 -个 类 区 入 另 一 类 的 内 部 ， 
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刀 并 不 具有 特殊 的 权限 ， 跟 被 腾 僚 的 类 也 没有 什么 特殊 的 关系 。 联 套 遂 党 被 用 十 实现 容器 类 
‘就 是 实现 一 些 数据 结构 的 类 ， 如 链表 、 散 列表 、 队 列 等 ), 现在 Ct+ 增 加 了 模板 (template) 这 
个 特性 ， 它 也 被 用 于 实现 容器 类 。 
继承 表示 派生 类 是 基 洲 的 一 个 变型 ， 它 们 之 间 如 何 相互 访问 ， 则 是 由 许多 详细 的 语义 来 
决定 与 联 僚 类 一 个 较 小 的 对 象 是 一 个 较 大 对 象 的 许多 组 成 部 分 之 -) 不 同 ， 继 承 表示 一 
个 对 象 是 “个 更 为 普通 的 父 对 象 的 特 型 。 我 们 不 会 认为 哺乳 动物 内 霸 僚 了 - -条 刹 ， 而 会 认为 
狗 继承 了 哺乳 动物 的 特征 。 请 设 寺 处 地 思考 上 自己 所 而 半 的 情形 ， 选 拌 合适 的 用 法 ， 


it.9 多 重 继承 一 一 从 两 个 或 更 多 的 基 类 派生 


C 语言 很 容易 让 你 在 开 枪 时 伤 着 自己 的 脚 ，C++ 使 这 种 情况 很 少 发 生 ， 但是， 一 旦 发 生 
这 种 情况 ， 它 很 可 能 囊 掉 你 整 杂 月 . 
——Bjarne Stroustrup 
多 重 继承 允许 把 两 个 类 组 合成 一 个 ， 这 样 结果 类 对 象 的 行为 类 似 于 这 两 个 类 的 对 象 中 的 
任何 一 个 。 它 把 树 形 类 体系 变 成 了 格 形 。 
继续 我 们 的 水 果 比 喻 ， 我 们 可 能 有 一 个 称 作 沙 误 的 类 ， 并 注意 到 有 些 水 果 类 的 对 象 也 能 
用 作 沙 司 。 这 给 予 类 型 体系 一 种 多 重 继承 的 特征 ， 表 示 如 下 ; 


沙 司 fSauce] 水 朵 (Fruit) 


水 果 沙 可 {FrmuitSauces) 


可 能 会 出 现 的 对 和 象 声 明 如 下 ; 


FruitSauce orange，cranberry; /i 这些 实例 既是 沙 司 也 是 水 果 。 


多 重 继承 比 单 重 继承 要 少见 得 多 ， 对 于 它 是 否 应 该 在 在 于 语言 中 也 曾经 是 激烈 辩 沦 的 话 
题 。 多 重 继承 在 一 些 OOP 语言 如 SmallTalk 中 并 不 存在 , 但 在 另 - 些 OOP 语言 如 Eiffel 中 却 
和 存在。 我们 应 该 注意 到 ， 人 在 现实 中 ， 类 型 体系 更 像 图 11-3， 而 不 是 图 11-2。 

多 重 继承 看 上 法 很 困难 ， 无 论 在 实现 上 和 使 用 上 都 是 一 个 容易 产生 错误 的 特性 ， 有 些 人 
兴 为 迄今 为 止 尚 无 邻 人 信服 的 例子 证 明 哪 种 设计 是 必须 采用 多 重 继承 的 。 
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MN 长 -一 m 一 > 


网 14-2 向 接 纺 永 


个、 
从 NN 
A 


图 11-3 和 多重 继承 


11.10 重 载 一 作用 于 不 同类 型 的 同一 操作 具有 相同 的 名 字 


乎 载 (overicad) 就 是 简单 地 复 用 一 个 现存 的 名 字 ， 介 使 它 操作 - 个 不 同 的 类 型 。 它 可 以 是 
庄 数 的 名 和 字 ， 也 可 以 起 一 个 操作 符 。 操 作 符 重 载 在 C 语言 中 已 经 以 :种 初步 的 方式 存在。 事 
灾 上 ， 所 有 的 语言 者 为 内 得 类 型 进行 了 柑 作 符 重 载 。 

double e, g, gg; 

jr Ly es 

8 = fg; 二 雪 加 法 a] 

Ki /* 整数 加 法 */ 

+ 运算 (操作 〉 人 在 上 面 丙 种 情况 下 起 不 一 样 的。 第 一 条 语句 将 会 产 小 一 条 浮 点 数 加 法 指 
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令 ， 第 -= 条 语句 则 产生 -条 整 数 加 法 指令 。 由 于 所 执 征 的 操作 是 问 -个 数学 概念 ， 所 以 操作 
符 的 名 字 也 应 该 是 “ 样 的 ， 由 十 C++ 允许 创建 浙 类 型 ， 程 序 员 也 可 以 为 新 类 型 重 载 名 字 和 操 
作 符 。 重 载 允 许 程序 员 复 放 首 数 名 和 绝 上 多数 的 操作 符 如 +、=、*、-、H 和 0) 等 ， 赋 茸 它 们 新 
的 含义 以便 用 十 用 广 定义 类 型 。 这 也 是 OOP 设计 哲学 中 把 所 有 对 象 作为 一 个 组 合 整体 的 思 
相 目 

重 载 (按照 它 的 定义 ) 首 是 在 编译 时 进行 解析 。 编 译 器 查看 操作 数 的 类 型 ， 计 核查 它 是 
香 是 该 操作 符 所 声明 的 类 型 之 ~-。 为 了 保持 程序 员 的 心智 健全 ， 应 该 为 一 个 树 似 的 操作 对 操 
作 符 进 行 重 载 (如 为 两 个 月 户 定义 类 型 的 加 法 重 载 + 操作 符 )。 千 方 不 要 上 | 诸如 下 面 这 种 傻 事 ， 
对 * 操 作 符 进行 重 载 ， 让 它 实际 上 进行 除法 运算 。 


1t.11 C++ 妇 何 进行 操作 符 重 载 


作为 一 个 例子 ， 证 我 们 重 载 “+” 抬 作 符 ， 为 水 果 类 定义 加 法 操作 。 首 先 ， 增 如 水 果 类 
的 加 法 操作 符 原 型 ; 
class Fruit { public: void peell}; slice(),; juicel}, 
int operator+ lrruit &f); ”7 重 载 “+” 操 作 符 
private: int weight, calories_par_o2z; 

}; 
然后 为 重 载 的 操作 符 为 数 提供 一 个 纹 数 体 ; 
int Fruit::operatcr+lFruit g&f}f 

Printff"calling fru:t addition\n"); // 这 样 我 们 就 能 看 到 它 被 调用 


return weight + f.weight; 
} 


和 以 前 一 样 ， 得 个 成 员 消 数 都 传 予 一 个 隐 式 的 this 指针 ， 人 允许 我 们 引用 操作 符 的 左 操作 
数 。 这 里 ， 加 法 的 右 操 作 数 是 参数 f{， 它 是 Fruit 类 的 一 -个 实例 ， 它 前 面 的 及 表示 它 是 道 过 传 
址 调用 的 。 

这 个 重 载 的 加 法 操作 符 函 数 可 以 像 下 面 这 样 调用 ， 


Apple apple; 
Fruit orange; 


int ounces = apple + orange; 

重 载 后 的 操作 符 的 优先 级 和 操作 数 〈 编 译 器 行 话 中 的 “arity ”) 与 原先 的 操作 符 相 同 。 这 
样 ， 你 可 以 发 现 ，C++ 表 直 如 果 你 预先 定义 加 法 操作 符 ， 就 可 以 把 苹果 和 桔子 相 加 。C++ 给 
予 “ 操 作 符 错误 ”这 个 短 琴 一 个 全 新 的 诠释 。 重 载 在 C++ 的 WO 中 也 非常 方便 ， 详 细 在 下 一 
节 描 述 。 
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11.12 C+t+ 的 输入 /给 出 (1/O) 


就 像 C 语言 具有 和 白 己 的 标准 WO 珊 数 库 一 样 ，C++ 的 特性 之 一 就 是 它 是 身 拥有 一 会 新 的 
LO 程序 和 概念 。C++ 有 “个 iostream.h 头 文件 ， 提 供 了 IO 接口 ， 使 TO 操作 更 为 方便 ， 也 
更 符合 OOP 的 理念 。 

C++ 使 用 << 操 作 符 《输出 ， 或 称 “ 揪 入”) 和 >> 拘 作 符 《〈 输 入， 或 称 “ 提 取 ”) 来 替代 CC 
语言 中 的 putcharO0 和 getchzrO 等 畏 数 。 

<< 和 >> 操 作 符 在 C 语 于 中 也 用 作 左 移 位 和 右 移 位 操作 符 , 但 它们 被 重 载 用 于 C++ 的 IO。 
编 详 器 查看 操作 数 的 类 型 ， 决 定 是 产生 移 位 代码 还 是 VO 代码 。 加 果 最 左边 的 操作 数 起 一 个 
流 (stream)， 该 操作 符 就 作为 WO 操作 符 。 使 用 操作 符 而 不 是 毅 数 米 操纵 VO 具有 四 个 巨大 的 

。 棵 作 符 可 被 定义 ， 用 于 任何 类 型 。 这 样 就 不 需要 为 得 种 类 型 准备 :个 单独 的 蝎 数 或 考 
字符 出 格式 化 限定 符 如 免 d。 

。 与 使 用 疯 数 相 比 ， 二 你 输出 多 条 信息 时 ， 使 用 操作 符 操 级 IO 其 有 概念 上 的 方便 性 。 
就 像 可 以 书写 i+j+k+1 这 样 的 表达 式 一 样 ,操作 符 的 左 结合 性 确保 你 可 以 合理 地 把 多 个 IO 
操作 数 链 在 一 起 : 

coutL << the value Ls "<< 1 <<enal ; 

。 它 提供 - -个 附加 的 层 ， 简 化 了 类 似 scanf0 这 样 的 消 数 的 格式 控 护 和 使 用 上 方法。 我 们 
应 该 认识 到 scanfO) 家 族 确实 应 该 进行 简化 (尽管 它 的 手册 非常 简短 )。 

* 对 << 和 >> 操 作 符 进行 重 载 ， 在 一 个 单 -的 操作 中 读 取 和 书写 整个 对 象 不 仅 是 可 能 的 ， 
而 且 十 非常 需要 的 。 在 前 面 的 草 节 里 已 经 有 过 一 个 这 样 重 载 的 例子 。 

你 仍然 可 以 在 C++ 中 使 用 C 语言 的 stdio.h 中 的 函数 , 但 尽早 转 间 C++ 的 VO 特性 是 非常 
值得 的 。 


tl.13 多 态 一 一 运行 时 绑 定 


多 态 (polymorphism) 源 二 希腊 语 ， 意 思 是 “多 种 形状 ”。 在 C++ 中 ， 它 的 意思 是 支持 相关 
的 对 象 其 有 不 同 的 成 黄 函 数 〈 但 原型 相同 ?》， 并 允许 对 象 与 适当 的 成 员 闭 数 进行 运行 时 绑 定 。 
C++ 通过 覆 病 override) 支 持 这 种 机 制 -一 所 有 的 多 态 成 员 责 数 具 有 相同 的 名 字 ， 巾 运行 时 系 
统 判 断 哪 一 个 最 为 合适 。 当 使 用 继承 时 就 要 用 到 这 种 机 制 ， 有 时 你 无 法 在 编译 时 分 辨 所 拥有 








! 不 要 把 C++ 多 jostream {以前 称 作 sueam) 这 个 IO 接口 和 无 关 的 UNIX 内 核 STREAM 框架 混淆 ， 后 者 是 用 主 设备 阳 动 程 庆 和 
用 户 进 程 之 间 的 通信 ， 

” 作 少 在 原文 中 也 使 用 下 生 {overload， 这 个 术语 米 表 示 这 种 机 制 ， 但 在 C++ 中 ，overioad { 重 载 】 和 ovemide 类 六 ) 显然 不 同 ， 
一 一 译 者 注 
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的 对 象 到 底 是 基 类 对 象 迁 是 派 乍 类 对 象 。 这 个 判断 并 调用 正确 的 函数 的 过 程 被 称 为 “后 期 绕 
定 (late binding)"。 存 成 员 虞 数 前 面 加 上 virtual 关键 字 告 诉 编 详 器 该 成 员 消 数 是 多 念 的 (也 就 
尽 庶 拟 户 数 )。 

件 寻 常 的 编 泽 时 重 碟 中 ， 函 数 的 原型 必须 显 苦 不 上 E， 这 样 编译 占 才 能 通过 全 看 参数 的 类 
型 判断 宕 此 调用 上 哪个 疝 数 。 但 在 虚拟 函数 中 ， 函 数 的 原型 必须 相同， 册 运 行 时 系统 进行 解析 
调用 哪 一 个 少数 。 多 念 是 我 们 将 讨论 的 C++ 的 最 后 “个 焦点 ， 遂 过 代 公 实例 来 解释 它 会 比 单 
纯 的 文字 更 容易 理解 。 





多 坊 是 指 一 个 削 数 或 操作 符 只 有 一 个 名 字 ， 但 它 可 以 用 于 几 个 不 同 的 派生 类 型 的 能 力 ， 
每 个 对 象 都 实现 该 操作 扒 一 种 变型 ,表现 一 种 最 适合 自身 的 行为 . 它 始 于 覆盖 一 个 名 字 一 一 对 
同一 个 名 字 进 行 复 用 ， 代 表 不 同 对 象 中 的 相同 概念 。 多 态 非常 有 用 ， 因 为 它 意 味 着 可 以 给 类 
似 的 东西 取 相 同 的 名 字 . 运行 时 系统 在 几 个 名 字 相 同 的 函数 中 选择 了 正确 的 一 个 进行 调用 ， 


这 就 是 多 态 。 


me 











让 我 们 从 所 熟悉 的 水 果 类 开始 ,我 们 为 水 果 类 增加 一 个 成 员 气 数 ,用 丁 为 水 果 去 皮 (peel)。 
同样 ， 我 们 并 不 细 究 水 果 去 皮 的 细节 ， 只 是 让 它 打 印 一 条 信息 。 
#ireciude <stdio.h> 
class Fruit { public: void peel{} 1 "peeling a base class friir\n"};] 
slicel!; 
juicel'; 
private: int weight, valories per_o2; 
}} 
当 声 明 … 个 水 果 对 象 ， 并 像 下面 这 样 调用 peel0 成 员 函 数 时 ; 
Fruit barnana; 
banana .peel {();， 


我 们 将 得 到 -条 信息 

peeling a base class fruit | 

到 目前 为 止 ， 一 切 正常 。 现 在 考虑 从 水 果 类 派生 苹果 类 ， 并 实现 苹果 类 白 己 的 peel0 成 
员 函 数 。 不 管 怎样 ， 苹 果 去 皮 的 方式 和 香 菩 去 皮 的 方式 还 是 有 所 不 同 的 ， 你 可 以 用 手 剥 去 否 
车 的 皮 ， 但 必须 借助 小 大 才能 削 去 昔 果 的 皮 。 我 们 知道 可 以 让 苹果 类 的 去 皮 成 员 半 数 与 水 果 
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类 的 去 皮 成 员 活 数 同 名 ， 因 为 Ct+ 会 用 覆盖 的 方法 进行 处 球 : 
class Apple 1: nublic Fruit { 
Pup1lIc: 
void peelit) 1 printft"peeiirg an aprle"r")?} 
void make_zandy_appletfloatl weiqght}); 
}1! 
让 我 们 志明 个 指向 水 代 类 的 指针 ， 并 让 它 指向 个 带 果 对 象 ( 它 继 藉 于 水 果 类 )， 看 看 
六 我 们 试图 去 皮 时 会 发 尘 什 么 。 
Fruit *ps 
oO = new Apple; 
pp peeli); 


姓 ! 如 果 这 样 做 ， 你 会 獒 得 下 而 这 条 信和 已: 


$ cc _ fruitSs .CPP 
和 与 ,CUt. 
peeling a base clacs fruit 


换 句 话说 ,为 萨 果 类 基 虽 定 做 的 peel() 成 员 冰 数 并 没有 被 调用 , 真 止 调 用 的 是 基 类 的 peel0 
成 员 声 煞 ! 


11.14 解释 


出 更 上 面 这 个 结果 的 原 寺 是 : 当 想 用 派生 类 的 成 员 胃 数 取代 基 类 的 同名 函数 时 ，C++ 要 
求 你 必须 预先 通知 纲 详 器 。: 重 知 的 方法 就 是 在 可 能 会 被 取代 的 基 类 成 员 此 数 前 面 如 上 virtual 
关键 了 了 。 木 章 贫 始 ， 在 提 到 virtual 关键 字 时 ， 我 曾 说 明 会 在 稍 后 对 它 进行 详 述 ， 了 现在 你 应 该 
明白 这 个 道理 了 。 你 需要 许多 背 鞭 知识 才能 理解 这 样 问题 ， 当 然 色 现在 为 止 ， 这 些 背 景 知识 
己 经 准备 就 绪 。 





为 什么 成 员 函 数 不 缺 当地 使 用 virtual? 不 管 怎样 ， 如 果 需 要 调用 基 类 的 成 员 通 数 ， 可 
以 使 用 下 面 的 方法 : 


p->Fruit::peelt{'. 


它 的 原因 和 C 语言 为 什么 不 缺 省 地 使 用 register 关键 字 有 异曲同工 之 处 一 它 是 一 
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菜 ii 音信 禄 浊 人 上 记 以 Cr+ 不 立法 个 


种 笨拙 的 优化 措施 . 既然 并 不 是 每 个 成 员 示 数 调用 都 需要 这 种 运行 时 的 间接 形式 ， 那 为 什 
么 曼 让 每 个 成 员 函 数 都 添加 一 个 额外 负 想 呢 ” 应 该 显 式 地 告诉 编译 器 哪些 成 员 况 数 党 要 


多 AN 
a 


Far A a A rN A TN A er 


从 当前 这 个 上 下 交 的 条 度 米 浇 ，virtval ( 虚 氢 ) 这 个 辣 多 少 最 得 在 此 用 词 不 当 。 在 计算 
机 科学 的 其他 领域 中 ，virtual 的 意思 是 用 产 所 在 到 的 汞 是 事实 革 并 不 存在 ， 它 只 是 用 其 种 方 
法 文 搂 的 纪 觉 肝 了 .这 里 ， 它 的 巧 吊 是 不 让 用 六 看 介 事 实 上 存在 的 东 上 是 【 基 类 的 成 员 晒 数 ). 
换 用 个 更 有 意义 的 关键 了 《有 时 然 长 得 不 切实 际 让 

choonse_the aporopriate method a._rurtime_for whatever obicer this_ ja 

《 企 运 行 时 根据 对 象 的 类 型 选择 合适 的 成 员 丙 数 ) 

也 可 以 用 一 个 更 简单 的 词 ， 就 是 先前 提 到 冯 的 placecholder。 


11.15 C++ 如 何 表现 多 态 


在 先前 的 例子 中 ， 我 们 在 基 半 的 成 员 亏 数 前 增加 virtwal 关键 字 ， 其 他 地 方 无 次 修改 ， 


Hincliude «<stcio.h> 


class Sruit 


EUbric: virtuar void peer{) 1 "veeling a base class FruilL :nr}:} 
SIlicell,; 
Juiceil}; 
brivate; jnt welgtt, caiories_ per_oz; 
3 


通过 编译 和 执行， 结果 如 下 : 


多 ce fruits,cop 
$$ a.outl 
peeling an apple 


这 个 结果 和 预想 的 完全 一 - 样 。 到 目前 为 止 ， 这 些 结果 都 可 以 在 编译 时 获得 ,但 多 态 是 
一 种 运行 时 效 桌 , 它 是 指 C++ 对 象 在 运行 时 决定 应 该 调用 哪个 函数 来 实现 某 个 特定 操 疾 的 
过 程 。 

运行 时 系统 察 肴 调用 虚拟 函数 的 对 象 ， 并 选择 适合 该 类 型 对 象 的 成 员 浮 数 。 如 果 它 是 一 
个 派生 类 对 象 ， 我 们 就 不 希望 它 调用 基 类 版 本 的 成 员 函 数 ， 而 是 希望 它 滑 用 派生 类 的 成 员 贞 
数 。 但 是 当 革 类 被 编译 时 ， 编 译 器 可 能 看 不 到 六 种 情况 。 央 此， 这 个 效果 必须 在 运行 时 动态 
实现 ， 用 CH+ 的 术语 就 是 “虚拟 实现 ”。 

单 继承 通常 通过 在 每 个 对 象 内 包含 -- 个 yptr 指针 来 实现 虚拟 请 数 。vptr 指针 指向 - -个 叫 
做 vtbl 的 函数 指针 疝 量 《 称 为 虚拟 函数 表 ， 也 称 V 表 )。 每 个 类 前 有 这 样 一 个 向 量 ， 类 中 的 
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符 个 虚拟 函数 在 该 章 显 中 部 有 一 条 记录 . 使 用 这 种 方法 ， 该 类 的 所 有 对 象 共 学 实现 代 合 。 眠 
拟 永 数 表 的 布局 是 预先 设置 好 的 ， 基 个 成 员 孙 数 的 拟 数 指针 在 该 类 所 有 子 类 的 虚拟 函数 表 中 
的 偏 移 地 址 都 是 -~ 样 的 。 伯 运行 时 ， 对 记 氢 成 员 渔 数 的 调用 是 首 过 vptr 指针 根据 适 闪 的 偏 移 
量 调用 虚拟 北 数 变 中 适 台 为 现 数 指针 来 实现 的 ， 它 是 -种 间接 的 调用 。 多 和 匣 继 承 的 情 六 更 为 
复杂 ， 需 昌 另 外 : 层 的 间 陵 形式 。 如 果 你 搞 不 明白 ， 可 以 对 它 四 一 由 网 ， 线 的 最 本 端 号 是 需 
要 谢 用 的 成 员 消 数 。 


11.16 新 奇 玩意 一 一 多 态 


在 多 仿 中 ， 你 古 以 发 汤 出 许多 新 奇 的 玩意 ， 但 有 时 候 它们 又 是 极为 本 质 的 东西 。 它 叫 使 
派 千 类 的 成 员 也 数 优先 于 法 类 的 同名 函数 获得 凋 用 ， 但 如 果 派生 类 对 虚拟 函数 未 曾 定制 ， 它 
也 可 以 调用 基 类 的 成 员 蝎 狐 。 有 了 时候， 成 员 陋 数 在 编译 时 并 不 打道 它 是 作用 于 本 类 的 对 象 还 
是 派生 于 本 类 的 子 类 对 篆 。 多 态 必须 保证 这 种 情况 能 够 正确 地 工作 。 

mailr(t) { 

APpPle apple; 
Fruit orarge; 
Fruit *p; 

PE = tapple; 
p -> DPeel1():; 


pb = koranges 
中 -> peell); 


} 
什 运 行 时 ， 结 果 将 会 是 ; 
第 a.out 


peeling an apple 
PEecling a base class fruit 








深入 思考 一 一 多 态 和 interposing 有 相似 之 处 


多 态 和 interposing 都 作 许 用 一 个 标识 符 来 命名 多 个 函数 。interposing 是 一 种 多 少 有 些 策 
批 的 方式 ， 它 在 编译 时 把 所 有 用 该 标识 符 命令 的 函数 都 绑 定 到 一 个 函数 中 。 多 态 则 显得 精巧 
一 些 ， 它 可 以 在 运行 时 根据 对 象 的 类 属 关 系 决定 调用 哪个 函数 . 
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t1.17 “C++ 的 其 他 要 点 


在 前 面 对 C++ 的 重点 进行 简要 介绍 时 ， 我 们 省 了 略 了 很 多 相对 较 小 的 概念 。C++ 中 有 许多 
更 详尽 的 规则 适 册 于 此 处 廊 提 及 的 概念 然而， 如果 能 够 精通 本 章 中 的 材料 ， 将 会 对 OOP 
的 概念 和 它们 在 C++ 中 的 表达 形式 有 … 个 基本 的 了 解 。 你 将 拥有 一 个 良好 的 开端 米 编写 实验 
性 质 的 C++ 程序 。 这 插 未 提 及 的 C++ 概念 还 有 : 

。 异常 (exception): C++ 的 这 个 概念 源 于 Ada， 也 源 于 Clu (MIT 所 井 发 的 “种 实验 性 
的 语言 ， 它 的 关键 媚 想 是 “cluster， 集 群 ”)。 它 用 于 在 错误 处 理 时 改变 程序 的 摔 制 流 。 蜡 党 
通过 发 生 错 误 时 把 处 理 白 动 切换 到 程序 中 用 于 处 理 错误 的 于 部 分 代码 。 从 人 而 简 化 错 识 处理。 

。 模板 (template)， 这 个 特性 支持 参数 化 类 型 ， 问 类 /对 象 的 关系 “ 样 ， 模 板 /的 数 的 关系 
也 可 以 看 作 是 为 算法 提供 种 “甜点 妃 其 ”的 方法 . 一 互 确定 了 基本 的 算法 ， 你 可 以 把 它 应 
用 本 不 同 的 类 型 。 它 类 似 于 Ada 中 的 泛 型 技术 和 Clu 中 的 参数 化 模块 。 它 的 党 义 比 较 复杂 ， 
下 面 的 代 但: 

em T™ TP min a TT bY 1 Trotrn {a eB ?a hr 

允许 你 对 min 函数 和 变量 a、b 赋予 任意 的 类 型 ‘该 类 型 必须 能 接受 < 操作 符 )。 有 些 人 
称 模 板 为 编译 时 的 多 态 ， 这 是 一 个 优点 ， 但 它 也 意味 着 -个 通过 模板 声明 的 操作 可 以 山 许多 
不 同 的 类 型 来 进行 ， 所 以 你 必须 人 在 编译 时 决定 使 用 哪个 类 型 。 

， 内 联 (inline) 函 数 , 程序 员 可 以 规定 某 个 特定 的 曲 数 在 行内 以 指令 流 的 形式 肯 于 《就 像 
宏一 样 )， 而 不 是 产生 一 个 函数 讽 用 。 

。 new 和 delete 操作 符 ， 用 于 取代 imalloc0 和 freef) 函 数 。 这 两 个 操作 符 用 起 来 更 方便 一 
些 (如 能 够 白 动 完成 sizect 的 计算 工作 ， 并 会 目 动 滑 用 合适 的 构造 两 数 和 析 构 孙 数 )。new 能 
够 中正 地 建立 一 个 对 象 ， 则 malloc0) 函 数 只 是 分 本 内存。 

。 传 引 用 调用 (call-by-rererence， 相 汉 于 传 掉 谢 用 ): C 诸 言 只 使 用 传 值 调 用 
{call-by-value)。C++ 件 语言 中 引入 了 传 引用 调用 ， 可 以 拒 对 象 的 引用 作为 参数 传递 。 





C++ 设 计生 标 : 往事 己 作 ， 且 看 今朝 


源 自 SIGPLAN Notices, 第 21 卷 , 第 10 号 , 1986 年 10 月 
“An overview of C+1-” 作者 : Bjame Stroustrup 


第 6 节 ， 丢失 了 什么 ? 
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C++ 的 设计 受 限于 严格 的 兼容 性 、 闪 部 一 致 性 和 高 效率 . 任何 特性 如 果 会 站 起 于 列 后 果 ， 
就 不 能 被 添加 到 C++ 中 : 

111 在 源 代码 一 级 或 链接 路 一 级 中 引起 与 C 语言 的 严重 不 兼容 性 ， 

[2] 会 给 不 使 用 该 特性 的 程序 带 来 运行 时 间或 空间 的 额外 负担 ， 

[3] 会 增加 C 程序 的 运行 时 间或 空间 需求 ， 

[4] 与 C 语言 相 比 会 显著 增加 编译 时 间 : 

[51 只 能 够 通过 在 编译 环境 (链接 器 、 载 入 器 等 ) 中 附加 条 件 来 实现 ， 无 法 简单 而 有 效 
地 在 传统 的 C 编程 环境 中 实现 ， 

有 些 也 许 应 该 被 添加 ， 但 由 于 上 述 准 则 最 终 还 是 被 介 爱 的 特性 包括 : 垃圾 收集 、 参 教化 
类 、 蜡 常 、 多 重 继承 、 对 六 发 性 的 支持 以 及 语言 与 编程 环境 的 整合 。 并 非 所 有 这 些 可 能 的 扩 
展 都 话 合 全 十 十 。 在 选择 和 证 计 语 言 的 特性 时 ， 如 果 不 对 其 实行 严格 的 限制 ， 其 结果 可 能 就 是 
一 堆 庞 大 、 策 拟 而 效率 低下 的 科 圾 ,C++ 设计 上 的 严格 限制 也 许 会 带 来 益处 , 并 继续 指引 C4 
的 发 展 , 

啊 ! 那 是 什么 年 代 啊 ! 那 时 的 关 国 总 统 还 是 里 根 ， 那 时 的 西红柿 调味 闭 还 是 一 种 菠菜、 
和 
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11.18 如果 我 的 目标 是 那里 ， 我 不 会 从 这 里 起 步 


编程 语言 有 一 个 特性 ， 称 为 正 交 性 (orhogonatity):| 它 是 指 不 同 的 特性 遵循 同 - -个 基本 所 
则 八 得 度 (也 席 是 字 全 一 科 特 件 于 助 于 学习 直 他 的 特 件 )， 例 如， 在 Ada 中 ， 程 序 员 .二 
自 了 包 (package) 的 工作 原理 ， 也 就 能 够 把 这 个 知识 应 用 丁 泛 型 包 中 。 今 人 不 快 的 是 ，C+… 中 
的 许多 特性 是 非 正 交 性 的 。 精 通 C++ 的 菜 个 特性 并 不 能 给 你 党 来 什么 线 家 或 向 你 局 发 适用 于 
共 他 特性 的 四 想 模型 .| 大 多 数 程序 员 选 择 了 只 使 用 C++ 中 较 简 单 的 -个 子 集 的 方法 ， 








TY TT A A 





DA yan wire [vivirmrereee re 人 人 ommpey 本 本 4 Aaron 


C++ 的 一 个 简单 子 集 


尽量 使 用 的 C++ 特性 : 

。 类 。 

， 构造 函数 和 析 构 函 财 ， 但 只 限于 函数 体 菲 常 简单 的 例子 . 
， 重 载 ， 包 括 操 作 符 重 载 和 IO， 

。 单 重 继承 和 多 态 ， 

避免 使 用 的 C++ 特性 : 
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。 模板 。 
。 上 庶 基 类 (人 (virtual base classes)。 
。 多 重 继承 。 


A WEYEVIWeww VHA A PAPARE RRT EOE ES SAMA -vsoeewooosns<ss----A < 


编程 语言 的 二 要 目 林 趾 提供 个 框架 ， 用 计算 机 能 够 处 理 的 方式 才 达 问题 的 解决 方法 。 
继 程 语言 虐 是 能 够 休 现 这 个 床 则 ， 就 越 成 功 。Fortran 语言 是 第 :个 高 级 语言 ， 它 提供 了 温 大 
的 方法 来 表达 数学 公式 {Fortran 这 个 名 宁 的 意思 起 “Formulja translation 公式 糊 译 ”) .COBOL 
语言 把 白 己 定位 在 文件 处 理 、 数 值 运算 和 输出 编辑 上 上， 并 在 这 些 领 域 浆 得 所 大 的 成 功 .C 诸 
言 周 系 统 程序 员 提 供 许 多 [1 硬件 直接 支持 的 操作 ， 它 并 不 使 用 许多 的 抽象 层 米 “ 挡 路 

一 门 语言 ， 如 果 它 的 结构 是 有 用 的 “建构 块 ” 便于 堆积 起 来 解决 其 个 特定 领域 的 问题 ， 
它 就 能 获得 成 功 。 决 定语 育 中 的 哪些 部 分 可 以 构成 “建构 块 ” 是 语 训 设计 中 最 重 归 的 部 分 。 
实现 细节 ， 像 把 分 号 作 号 语句 终结 符 (如 C/C++ 语 将) 还 是 诗 名 分隔 符 《如 Pascal 语言 》 这 
样 的 问题 也 不 可 忽略 ， 但 “建构 块 ” 的 问题 是 关键 性 的 。C++ 语 言 的 成 荔 程 度 取 决 于 空 的 特 
性 是 合 是 民 好 的 “建构 块 ” 能 够 解决 有 有 趣 的 问题 这 个 基础 ， 也 取 关 于 语 过 能 否 被 止 常 的 程序 
员 吕 靠 地 使 用 。 

有 些 人 声称 C++ 类 会 给 软 件 的 复 用 性 带 来 革命 性 的 进展 。 复 用 是 软件 科学 的 - -个 崇高 而 
又 腾 腊 的 日 标 。 继 承 看 上 去 并 不 能 完全 解决 复 用 问题 。 囊 些 记性 好 的 人 也 许 还 记得 十 年 询 为 
Ada 所 设立 的 庞大 目标 。 计 :我们 打 个 比方 ， 把 一 个 计算 机 程序 比 作 是 本 书 。 然 后 你 既 有 一 
个 图 书馆 ， 又 有 一 个 程序 库 。 你 急 复 用 程序 中 的 - - 些 子 程序 ， 就 好 像 是 书 中 的 部 分 音节。 





设计 挑战 ，C++ 机 器 


过 去 ， 有 些 人 制造 了 一 - 些 具有 特殊 用 途 的 计算 机 硬件 ， 它 们 在 执行 菜 种 特殊 的 语言 时 效 
率 非 常 高 : 

Algol-60: 衬 期 的 Bur-oughs 处 理 器 

Lisp: Symbolics Inc， 

Ada: Rational Computers 

一 台 C++ 机 器 会 是 什么 样子 的 呢 ? 为 什么 所 有 这 些 特 殊 的 语言 机 器 的 下 场 都 很 凄惨 呢 ? 

这 是 一 个 难以 回答 的 问题 一 -无 法 用 一 个 共同 的 主题 来 描述 ， 单 一 语言 机 器 的 市 场 总 是 
不 如 通用 语言 的 机 器 .工作 站 轻易 地 击败 了 Lisp 机 器 .冷战 的 结束 也 为 Ada 机 器 划 上 了 句号 。 
Burroughs 作为 Unisys 的 一 部 分 仍 在 奋力 挣扎 。 
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问题 是 无 法 通过 从 其 亿 书 中 裁 曾 和 炳 贴 完 整 的 段落 来 创建 任何 有 有 价值 的 读本 ， 这 个 抽象 
的 层次 是 错误 的 。 可 以 从 单个 单词 或 字母 的 屋 次 《对 应 于 代码 的 单行 或 子 符 〉 上 进行 多 本 的 
共 学 。 但 把 这 些 词 成 字 组 一 一 截 前 出 来 的 工作 蜗 大 得 吓人 人， 还 不 如 让 它 保 持原 样 ， 自 己 另 起 
炉灶 从 头 开始 。 与 此 相同 ， 在 库 的 层次 上 进行 软件 的 复 用 实际 上 比 预想 的 效果 要 差 。 

右 ` -小 部 分 特殊 日 的 的 实用 程序 能 够 被 共享 ， 数 学 阴 数 库 、 一 些 数据 结构 程序 以 及 排序 
和 查找 库 浮 数 。 就 是 它们 了 1! 它们 好 比 起 书 中 的 图 表 或 参考 资料 ， 它 们 可 以 被 整个 地 引用 ， 
其 他 程序 员 也 能 够 理解 它们 ， 

C++ 在 软件 的 复 用 性 方面 或 许可 以 比 以 前 的 诸 言 圾 得 更 大 的 成 功 。 因 为 C++ 中 的 继承 的 
风格 基于 对 象 ， 既 允许 数据 的 继承 ， 也 允许 代码 的 继承 。Ada 的 泛 型 技术 也 能 做 到 这 一 点 ， 
但 Ada 语言 的 特性 过 于 牧 挡 , 而 且 对 于 绝 大 多 数 程序 员 来 说 显得 过 于 抽象 。 继 续 上 和 面 的 比方 ， 
C++ 可 以 使 图 书 的 借阅 登记 更 为 方 使 , 但 你 仍然 面临 如 何 合理 地 拷贝 书本 的 相关 部 分 的 问题 ， 


1i.49 它 或 许 过 于 复杂 ， 但 却 是 惟一 可 行 的 方案 


在 本 书 的 开始 儿童 ， 我 们 已 经 见识 了 CC 语言 的 - 些 泥 重 弱 点 。 如 果 C++ 能 够 在 保持 C 语 
言 风 格 的 基础 上 浆 补 这 些 弱 点 ， 那 将 非常 令 人 欢欣 鼓 笑 。 话 虽 如 此 ， 但 C++ 并 没有 这 样 履 ， 
内 为 这 个 想法 本 来 就 不 对 。C++ 确 实 有 - ` 些 改进 ， 但 它 仍然 保留 了 诸 言 的 许多 缺陷 ， 而 且 
在 它 的 上 面 叉 堆积 了 大 量 复 杂 的 东西 。C 语言 诛 先 的 设计 哲学 “所 右 特 性 都 不 需要 隐 式 的 运 
行 时 支持 ”已 经 作 了 一 定 程 度 的 妥协 。 


Ar be Dn 





C++ 对 C 语言 的 改进 


。 在 CC 语言 中 ， 初 始 化 一 个 字符 数组 的 方式 很 容易 产生 错误 ， 就 是 数组 很 可 能 没有 足 
够 的 空间 存放 辣 尾 的 NULL 字符 . C+ 对 此 作 了 一 些 改进 , 像 char b[3] = “Bob” 这 样 的 表达 式 
被 认为 是 一 个 错误 ， 但 它 往 怠 语 言 中 却 是 合法 的 。 
。 类 型 转换 既 可 以 号 成像 float(i) 这 祥 看 上 去 更 顺眼 的 形式 ， 也 可 以 写成 像 (float)i 这 样 
稍 显 怪异 的 忆 语 言 风格 的 形式 ， 
。 C++ 允 许 一 个 常 芋 整数 来 定义 数组 的 大 小 
const int size = 128; 
char a[lsizel]; 


这 在 C++ 中 是 允许 的 ， 但 在 C 语 言 中 却 是 错误 的 。 
。 声明 可 以 算 插 于 语 抽 之 间 。 在 C 语言 中 ， 一 个 语句 块 中 所 有 的 声明 都 必须 放 在 所 有 
语 多 的 前 面 。C++ 去 掉 了 这 个 专横 的 限制 ， 做 得 非常 好 ， 上 既然 这 种 做 法 也 会 引起 与 C 语言 的 
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不 兼容 ， 那 为 什么 不 进行 得 彻底 一 些 、 为 秋 怖 的 C@ 语 言 声 明 语法 提供 一 种 更 简单 的 替代 方案 
呢 ,? 

尽管 C++ 显得 过 于 复 深 ， 但 它 是 对 CC 语言 惟一 成 功 的 改造 方案 ， 拥 有 大 群 的 支持 者 .所 
有 在 ATAT 开发 的 新 东西 气 说 现在 都 已 加 入 到 C++ 中 。，Windows NT ( 它 出 现 较 晚 ， 而 且 比 
想象 中 的 要 慢 ， 体 积 也 非常 庞大 ) 的 图 形 部 分 就 是 用 C++ 编写 的 。 现 在 ， 大 多 数 新 型 软件 开 
发 工具 、 应 用 程序 库 和 高 级 技术 都 是 用 CH 编写 的 ， 或 至 少 是 它 的 ANSI C 子 集 ， 不 知道 要 
过 多 少时 间 , 我 们 可 以 看 到 由 于 C++ 的 特性 ( 而 不 是 C 的 特性 ) 而 引起 或 恶化 的 壮观 的 Bug， 
就 像 让 AT&T 丈 个 长 话 网 络 次 疾 的 那个 Bug 一 样 。 

但 这 并 没有 什么 。 上 尽管 存在 缺陷 ，C++ 仍 将 被 1 泛 使 用 ， 我 们 希望 它 最 终 能 向 -种 嘲 好 
的 形式 发 展 。 





从 C 转换 到 C++ 


学 习 Ct+ 最 好 的 方式 琉 是 从 它 的 ANSIC 子 集 开始 编程 。 避免 使 用 早期 基于 CFront 的 纺 
译 器 ， 它 所 产生 的 是 C 代码 而 不 是 机 器 代码 。 把 C 语言 作为 一 种 可 移植 的 机 器 语言 事实 上 会 
使 链接 和 调试 复杂 化 , 因为 CFront 把 所 有 的 函数 名 字 混 合 在 一 起 , 为 参数 信息 编写 内 部 代码 ， 
名 字 混 合并 不 可 靠 ， 它 会 带 来 可 怕 的 危险 ， 并 可 能 长 期 存在 于 C++ 中 .与 C++ 相反 ，Ada 对 
这 个 问题 的 处 理 非常 得 体 ， 而 且 它 并 不 使 用 不 正规 的 实现 方法 来 定义 语言 的 语义 。 名 字 混 合 
是 一 种 在 不 同 的 文件 之 间 进 行 类 型 检查 时 采用 的 权宜 之 策 ， 但 它 瞳 示 你 所 有 的 C4+ 代 码 必 须 
用 同一 个 编译 器 编译 ， 因 为 名 字 混 合 策 略 在 不 同 的 编译 器 上 可 能 各 不 相同 。 对 于 C++ 的 复 用 
模型 而 言 ， 这 是 一 个 巨大 的 缺陷 ， 因 为 它 有 效 地 防止 了 二 进 制 一 级 的 复 用 。 

这 里 有 一 个 代表 性 的 鲍 子 ， 说 明了 C 语言 并 非 C++ 的 子 集 的 部 分 ， 并 提示 何 处 可 能 隐藏 
着 麻烦 。 

0 人 在 语言 中 不 丰 在 的 限制 人 





: 元 束 的 员 吉 原型 户 朋 在 CH 中 是 人 须 的 | 但 在 C 语 言 中 却 没 这 么 严格 
。 在 C++ 中 ， 由 typejef 定义 的 名 字 不 能 与 已 有 的 结构 标签 冲突 ， 但 在 避 语 言 中 却 是 允 
许 的 《它们 分 属 不 同 的 名 字 空间 ) 。 
。 当 voidx 指 针 赋值 给 男 一 个 类 型 的 指针 时 ，C++ 规 定 必须 进行 强制 类 型 转换 ， 但 在 辟 
语言 中 却 无 必要 ， 
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在 C++ 和 C 语 言 中 含义 不 一 样 的 特性 : 

。 C++ 至 少 增加 了 十 几 个 关键 字 。 这些 关键 字 在 C 语言 中 可 以 作为 标识 罕 使 用 ,但 如 果 
这 样 做 了 ， 用 C++ 编译 器 篇 译 这 些 代码 时 就 会 产生 错误 信息 ， 

。 在 C++ 中 ， 声 明 六 以 出 现在 语 身 可 以 出 现 的 任何 地 方 . 在 C 语言 中 的 代码 块 中 ， 所 
有 的 上 声明 必须 出 现在 所 有 : 洛 负 的 前 面 。 

。 在 C++ 中 ， 一 个 内 层 范围 的 结构 名 将 会 隐 沽 外 层 空间 中 相同 的 对 背 名 、 在 忆 语 言 中 
则 非 如 此 。 

。 在 C++ 中 ，、， 字 符 常量 的 类 型 是 char， 但 在 CC 语言 中 ， 它 们 的 类 型 是 int， 也 就 是 说 ， 
在 C++ 中 ，sizeofl'a’) 的 结果 是 |， 而 在 CC 语言 中 ， 它 的 值 要 大 一 些 . 

” 由 于 C++ 增加 了 新 的 1/ 注 释 罕 ， 有 时 会 在 两 种 语言 中 产生 微妙 而 怪异 的 差别 (第 2 章 


C 和 C++ 之 间 的 不 同 乙 处 还 有 急 多 , 世 现 在 你 已 经 知道 了 足够 多 的 可 能 引号 危险 的 情况 。 
所 以 你 要 保持 笃 惕 ， 避 免 爷 险 的 出 现 。 当 对 编译 器 和 所 有 几 于 ANSI C 这 个 C++ 子 集 的 工具 
三 如 指 党 村， 便 可 以 展开 址 膀 ， 定 义 白 己 和 的 类 。 选 择 -本 优秀 的 C++ 书籍 《浏览 数 朋 ， 远 择 
一 本 在 风格 上 你 最 过 次 的 )， 注 意 它 必 须 拒 握 住 这 门 语 言 的 脉搏 《C++ 诸 言 仍 在 发 展 之 中 )， 
它 必须 涵盖 异常 和 模板 ， 这 两 个 特性 是 迄今 为 二 :最 晚 加 入 错 C++ 的 ， 

和 C 诸 专 - - 样 ，C++ 语 言 的 标准 化 也 是 由 ISO 和 ANSI X3J16 一 起 进行 的 。 最 乐观 的 估 
计 也 家 要 六 年 ， 也 就 是 1996 年 ,才能 完成 C++ 语言 的 标准 化 *。 注意 你 的 蔬 中 应 该 提 及 ANSI 
C++ 的 进展 。 














protected abstract virtJal base pure virtual Private destructor 是 什么 ? 


让 我 们 对 它 进行 仔细 分 析 ， 这 需要 一 些 时 间 。 上 面 这 身 话 实际 上 可 以 分 成 两 个 部 分 | 从 
一 个 protected abstract virtual base 派生 而 来 的 pure virtual private destructor， 

“ private destructor 训 是 一 个 对 象 离开 其 生存 范围 时 所 调用 的 函数 。 “private” 表示 它 
只 能 被 本 类 的 成 员 函 数 或 友 元 friend) 访 问 。 


! 1994 年 一 -译音 注 
” 和 实 上 是 1998 年 。 一 一 泽 者 注 
: 友 苞 不 是 类 的 成 负 明 数 ， 但 它 训 以 涉 癌 类 的 private 和 public 成 只 ， 友 抑 可 以 是 胃 数 或 类 ， 管 此 须 在 它 能 禹 访问 的 类 中 再 只 。 
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。 pure virtual 也 数 本 身 没 有 代码 ,但 它 可 以 通过 继 采 作为 派生 类 虚拟 函数 实现 的 指导 准 
则 ， 

。 pure virtual destmuctor 只 有 它 被 派生 类 绑 羔 以 后 才 有 意义 、 由 于 析 构 还 数 能 够 自动 进 
行 类 缺 省 的 清理 工作 .如 司 调用 成 员 或 基 类 的 析 构 函数 一 样 ， 所 以 通常 并 不 需要 在 析 构 函数 
的 定义 中 显 式 地 编写 任何 代码 . 

应 该 解释 清楚 了 吧 ? 示 我 们 看 一 下 第 二 部 分 : 

” abstract virtual bare 表示 基 类 是 被 多 个 多 重 继承 的 类 所 共享 ( 它 是 庶 基 类 ) ， 它 至 少 
包含 一 个 纯 不 通 数 (pure virtual function)， 其 他 的 类 通过 继承 从 它 派生 (所 谓 抽 谊 基 类 )。 庶 
基 类 也 有 其 特殊 的 初始 化 语义 。 

*。 protected abstract virtual base 类 是 指 我 们 的 类 是 以 protected 形式 派生 的 .该 类 的 后 续 
派生 类 可 以 访问 父 类 的 信息 ， 但 其 他 的 类 则 不 允许 ， 

现在 ， 把 它们 放 在 一 起 ， 一 个 protected abstract virtual base pure virtual private destructor 
就 是 一 个 析 构 函数 ， 它 具有 下 列 特点 : 

。 只 能 被 该 类 的 成 员 喇 数 或 友 元 调用 ， 

。 在 声明 它 的 基 类 中 没有 定义 ， 但 它 将 在 派生 类 中 定义 ， 

。 它 ( 指 派生 类 的 ) 共享 一 个 多 重 继 承 的 基 类 ， 

， 它 ( 指 基 类 的 ) 之 protected 方式 继承 . 

上 一 次 我 们 是 什么 时 间 用 到 它 呢 ? 嗯 .,., 想 起 来 了 ! 我 们 从 来 没有 用 到 过 它 ， 这 个 声明 是 
不 是 让 人 想起 快速 傅立叶 奕 接 的 程序 试验 呢 ? 从 复杂 性 上 讲 ， 它 它 可 以 与 之 比 启 

在 C++ 的 代码 中 ， 大 妆 可 以 这 样 表达 : 

class vbc1{ 
protected: virtial void xf) 
private: wirtual ~veb{) = 0; 

}; 

ff vbc 是 -一 个 抽象 类 、 畴 为 它 包 含 纯 庶 拟 逊 数 . 

class XX : virtuai rotected vbce 1 

/7 X 虚 所 地 从 继承 于 ybc， 而 县 vbc 的 protected 成 员 也 是 X 的 protected 成 员 ， 

ff 所 以 vbc 是 Xx 的 "protected abstract virtual base" 类 . 


protected: woic v!) {]} 


~Xf) { /* 执行 一 些 x 类 的 清理 工作 */ ) 


= 0， 


}: 
/7 当 一 个 X 对象 被 销 筑 时， X: :六 () 被 调用 ， 然 后 ,，,， 





如 : 
Class fruit { private: ... 
Public: ... 
fnend action(): 
上 . 
action() 冰 区 庆 是 fruit 类 的 到 元 :位 不 是 它 的 成 员 晴 数 )， 它 可 以 廊 辣 fruit 英 对 象 的 private 成 员 。 一 一 译 阁 注 
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i xX 的 “protected abstract virtuai base pure virtua!l private destructor” 
也 被 调用 。 所 以 尽管 它 在 声明 中 是 纯 函 数 ， 但 它 仍然 需要 定义 . 

正 是 这 种 语义 上 的 复 洲 性 ，C++ 才 有 了 过 度 复 杂 的 名 声 。 问 题 并 不 是 出 在 单个 的 语言 特 
性 上 ， 而 是 多 个 特性 交织 在 一 起 相互 作用 产生 了 复杂 性 .对 这 个 问题 的 讨论 就 到 此 为 止 ， 读 
者 可 以 自己 得 出 结论 。 


TR TOA SSI SSSR dn a FOO TINS ERE OP Cama 


11.20 轻松 一 下 一 一 死亡 计算 机 协会 


此 上 存在 很 多 各 种 各 样 的 和 计算 机 相关 的 组 织 ， 其 中 最 不 寻常 的 一 个 奔 怕 要 算 死 广 计算 
机 协会 (Dead Computers Society)。 

死亡 计算 机 协会 的 名 宕 源 寺 “已 故 诗人 协会 ? 后 者 实际 上 是 一 个 回 尚 二 代 诗 人 的 群体 。 
死亡 计算 机 协会 尝 尚 的 目标 是 已 不 复 存 在 的 计算 机 体系 结构 。 它 始 于 1991 年 加 州 圣 克 拉 拉 
ASPLOS(Architecture Support for Programming Language and OS5， 编 程 诸 言 和 操作 系统 的 架 
构 葡 持 ) 会 议 -个 非 正式 的 过 论 小 组 。，- 群 到 会 的 朋友 和 同事 注意 旬 他 们 中 的 许多 人 曾经 在 
现 已 不 再 使 用 的 系统 上 工作 。 

他 们 决定 成 立 死 亡 计算 机 协会 , 让 人 们 重新 想起 这 些 系 统 。 他 们 举办 了 开放 式 的 库 谈 会 ， 
讨论 与 此 相关 的 主题 。 他 们 希望 一 个 充 江 智慧 的 回顾 能 够 让 未 来 的 设计 者 吸取 以 前 的 教训 。 
什 何人 只 坚 对 已 不 复 存 在 的 计算 机 系统 (最 理想 的 情况 是 创建 该 系统 的 公司 也 不 复 存 在 了 ) 
的 设计 、 剂 建 或 编程 有 所 帮助 ， 都 可 以 加 入 刘 死 亡 计算 机 协会 中 。 已 经 不 复 存在 的 计算 机 系 
统 非常 之 多 ， 表 11-3 列 出 了 其 中 的 一 部 分 。 





表 11-3 已 不 复 存 在 的 计算 机 系统 
死亡 计算 机 荣誉 榜 
* American Supercomputer In:. + Intel iPSC/ 
* Ametek /Symult " Intel iPSC/2 


* Astronautics Intel / Siemens BiiN 


" Burroughs BSP * Masscomp { Concnrrent 
* CDC 7600. Cyberplus " Multiflow 

* CHoPP » Myrias 

" Culler Scienlilic * Niche 

” Cydrome * Prisma 

* Denelcor * SCS 


» Elxsi *。 SSj 
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外 亡 计 算 机 闪 誉 述 
二 Ran 此 Sutherland CD | * Star Technologies 
» ETA/CDC » SuperTek 
*， FLEX(Flexible Computer) *， Suprenumt Siemens 
” Goodycar Acrospacc/Loral DataFlow Systems * Texas Instruments ASC 
* Guiltech/SAXPY "Topologix 
* Floating Point Systems AP-]ine nd T-series » Lnisys lSP 


» [nte] 432 


另 一 方面 ， 任 何人 只 划 认 同 这 个 协会 的 守旧， 也 可 以 加 入 该 协会 . 在 协会 的 于 沫 会 议 上 、 
参加 者 超过 了 350 人 ， 

押 会 的 主持 大 试图 让 成 员 明 白 “ 协 会 的 惟一 事务 ， 压 倒 一 切 的 工作 ， 屿 起 关注 你 的 死 T: 
计算 机 ,。”Elxsi 设计 亚 表 公决 策 首 在 推动 技术 发 展 六 面 太 起 动 ， 在 时 机 尚 不 成 谎 之 际 就 开始 
使 用 ECLemitter-coupled ipgic， 发 射 极 耦 极 逻 辑 )。 介 是 ，Multiflow (差不多 和 Elxsi 回 时 退 
出 历史 挟 台 ) 的 首席 架构 师 坤 认为 ， 公司 不 采用 ECL 的 决定 是 导致 Multiflow 最 终 消 蕊 的 腺 
调 过 =5 

人 家 所 收 得 的 惟 - - 共 记 大 概 就 赴 管 理 和 市 场 状况 是 导 敏 许多 公司 破产 的 原 共 ， 比 单纯 的 
技术 失败 更 为 常 气 。 这 也 是 可 以 理解 的 ， 那 些 不 时 刻 证 意 烦 客 调 求 的 公司 终 穷 礁 以 为 继 ， 最 
能 掌握 这 项 艺术 的 公司 往往 能 获得 成 功 。 

会 工 偿 有 些 较 小 的 技术 主题 ， 像 如 何 让 你 的 产 册 准 以 编程 (如 CDC7600 的 双 上 内 存 ， 
战 使 用 补 码 运算 的 机 器 ， 或 既 线 忍 又 罕见 的 60 比特 的 学 宽度 ) 等 ， 这 些 痢 意义 不 人 今 人 非 
常 吃惊 的 是 ， 会 上 竟然 没有 出 现 一 个 主流 的 共同 技术 主题 ,也许 本 来 就 不 存在 吧 . 尽管 如 此 ， 
有 一 点 是 肯定 的 : 我 们 从 我 们 错误 中 学 到 的 要 比 从 成 功 中 六 到 的 要 多 得 多 。 


11.21 更 多 阅读 材料 


我 发 现 有 一 本 书 非 常 有 有用， 部 就 是 C: A Reference Manual， 作 省 Samuel P Harbison 和 
Guy L. Steele(Englewood Cliffs, Prentice Hall)。 Harbison 和 Steele 为 许多 不 同 的 计算 机 系统 开 
发 了 ~ 个 家 族 的 C 编译 器 ， 这 些 计算 机 系统 的 范 王 非常 广 。 他 们 在 自己 的 经 验 基 础 上 编写 了 
这 本 书 ， 书 中 字 颗 行 闻 内 烁 着 他 们 敏锐 的 润 察 旋 。 
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稍微 懂 些 硬件 知识 是 非常 危险 的 ， 一 位 程序 员 把 一 张 新 奇 的 能 演奏 渗 歌 的 圣诞 卡片 拆 了 
开 来 ， 取 出 其 中 的 压 电 乐 由 芯片 。 他 偷偷 地 把 它 安装 在 老板 的 键盘 上 ， 并 连接 到 一 个 发 光 二 
极 管 上 。 他 进行 了 测试 ，- 一 个 能 够 点 亮 发 光 二 极 管 的 电压 足以 驱动 其 中 一 块 芯片 . 

接着 ,我 ( 噢 ! 说 错 了 ， 我 指 的 是 那 位 程序 员 ) 修 改 了 系统 编辑 器 ， 当 它 局 动 时 点 毫发 光 
二 极 管 ， 当 它 退 出 时 关闭 发 光 二 极 管 。 结 果 : 只 要 老板 一 使 用 这 个 编辑 器 ， 他 的 终端 就 会 持 
续 演 奏 圣 谴 颂歌 ! 半 小 时 以 后 ， 隔 壁 办 公 室 的 人 们 和 群情 激愤 蜂拥 而 至 ， 迫 使 老板 停 于 工作 ， 
直到 秘 事 原因 被 发 现 为 止 . 

一 一 Te Second Official Handbook of Practical Jokes' 


A.1 硅谷 程序 员 面 试 


本 附 丈 提 供 了 一 些 在 顶级 公司 寻找 位 置 的 C 程序 员 新 试 过 程 的 提示 。 尖端 计算 机 产业 最 
值得 称道 的 事情 之 -总 是 选择 新 雇员 加 入 队伍 的 不 导 常 方法 。 人 在 许多 产业 中 ， 管 理 间或 经 埋 
全 权 人 负责 员工 的 录取 ， 伺 第 实 上 他 所 提出 的 应 征 条 件 往往 只 有 他 自己 才 符 合 。 和 但 是 ， 丰 软件 
开发 的 尖 瘦 领域 ， 尤 共 是 高 科技 企业 刚刚 启动 时 ， 程 序 贡 往往 比 决定 哪 位 候选 人 是 技术 最 储 
的 “个 人 应 征 者 ”的 经 型 更 有 资格 说 三 道 四 。 需 要 做 一 些 系 统 开发 的 天 才 程 序 员 极 为 罕见 ， 
对 他 的 要 求 也 格外 具体 。 所 以 有 时 候 技 术 能 力 是 你 寻求 工作 面试 时 唯一 重要 的 特长 。 

记 以 ， 程 序 员 向 试 就 彤 成 了 一 种 非常 独特 的 风格 。 经 理 根据 公司 的 策略 ， 在 众多 人 面试 阁 
中 过 找 人 才 。 那 些 有 户 入 转 者 接着 要 进行 一 番 法 术 上 的 并 格 考 核 ， 考 核 省 是 开发 队伍 的 每 个 
人 人 ， 而 不 仅仅 是 经 理 。 一 个 典型 的 工作 而 试 将 持续 一 整 大 ， 包 括 连 续 与 入 七 个 不 同 的 工程 师 
进行 一 小 时 左右 的 会 谈 一 -- 他 必须 让 所 有 人 信服 他 的 确 有 能 力 加 入 到 开发 小 组 中 ， 才 能 得 到 
一 份 工作 承诺 ， 

工程 是 们 常常 有 - 些 自己 最 喜欢 问 的 问题 ， 本 章 就 包含 了 一 些 工程 师 们 喜欢 的 问题 。 浊 
露 这 些 “ 机 密 ” 并 无 害处 -一 - 位 阅读 了 本 书 的 程序 员 很 可 能 己 经 盾 有 足够 的 知识 ， 足 以 加 
入 一 家 优秀 的 软件 公司 。 这 些 问 题 中 的 许多 源 于 我 们 尝试 编程 的 真实 算法 ， 现 在 已 经 被 其 它 
人 用 新 的 问题 所 取代 。 当 然 ， 你 在 面试 候选 人 时 并 不 仪 仪 看重 他 们 对 问题 作 什么 样 的 反应 ， 
， 作者 Peter van der Linden, 四 1991 by Peter van der Linden。 经 Dutton Signet(Penguin Book USA Jnw. 的 分 部 ) 侈 许 合 用，。 
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你 冲冲 也 很 在 意 他 们 此 怎 桩 做 出 肥 应 的 。 他 们 是 不 是 对 一 个 问题 深 岂 熟 虑 ， 提 出 儿 种 可 能 性 ， 
还 妨 件 脑子 旦 “有 想法 束 暗 上 I 而 出 ?他 们 在 说 明和 昌 己 的 思路 时 所 提 的 论据 是 否 有 是 够 的 涪 服 
力 ? 他 们 是 外 是 对 ， 个 明 导 错误 的 策略 四 执 已 匈 ， 偿 是 思维 灵活 ， 很 快 就 完善 自己 的 答案 ? 
下 向 的 有 些 问 题 产 牛 了 最 立 怪 的 答案 .你 可 以 日 已 试验 “上 下， 搞 呈 :下 自己 的 份量 ! 


A.2 怎 伴 才能 检测 到 链表 中 存在 循环 


这 个 问题 看 上去 比较 简单 ,“ 您 样 才能 检测 到 链表 小 存 在 御 环 ? ”人 提问 者 不 断 对 问题 施 
加 一 些 额外 的 限制 ， 使 这 个 问 题 很 快 就 变 得 向 日 独 狼 ， 

通常 第 一 种 答案 : 

对 沪 问 过 的 每 个 元 素 作 个 标记 , 继续 避 历 这 个 链表 ,如 果 过 到 某 个 已 经 做 过 标记 的 万 素 ， 
说明 链表 存在 循环 。 

第 二 个 限制 : 

这 个 链 友 位 于 具 读 凡人 有 区 域 ， 无 法 在 元 素 土 作 标记 。 

通常 第 二 种 答案 ; 

访问 每 个 匹 素 时 ， 丰 它 存储 在 … -个 数组 中 。 检 多 得 一 个 后 继 的 元 素 ， 看 看 它 是 徊 已经 
存在 于 数组 '|1。 有 时 候 ，” 些 可 和 擒 的 程序 员 会 纠缠 丁 如 何 用 散 列 表 来 优化 数组 访问 的 细节 之 
和 路， 结果 在 这 - -关卡 过. 

第 三 个 限制 : 

噢 ! 内 存 空 间 韭 营 有 限 ， 无 法 创建 … 个 足够 长 度 的 数组 。 然 而 ， 可 以 假定 如 果 链 表 沾 在 
在 循环 ， 它 出 现 件 前 NN 个 元 素 之 中 。 

通常 第 三 种 答案 (如 果 这 位 程序 员 能 够 到 达 这 一 步 ); 

设置 一 个 指针 ， 指 辐 链 去 的 头 部 。 人 在 接 下 去 对 直到 第 N 个 元 素 的 访问 上 中， 把 N-t 个 元 素 
依次 问 指 针 指向 的 元 素 进 行 比 较 。 然 后 指针 移 向 第 一 个 无 素 ， 把 它 与 后 下 N-2 个 外 素 进 行 比 
较 。 根 据 这 个 方法 依次 进行 比较 ， 如 果 出 现 比 较 相 等 的 情况 就 说 明 广 N 个 元 素 中 存在 循环 ， 
否则 如 果 所 有 N 个 元 素 两 酉 之 问 进行 比较 部 不 相等 ， 说 耻 链 表 中 不 存在 循环 。 

第 四 个 限制 

响 ! 不 ! 链 胡 的 长 度 是 任意 的 ， 而 且 循环 可 能 出 现在 什 何 位 置 。( 即 使 是 优秀 的 候选 者 也 
会 企 这 一 关 健 壁 ) 

最 后 的 答案 ; 

首先 ， 排 除 一 种 特 鳞 的 清 况 ， 就 是 3 个 元 素 的 链表 中 第 2 个 元 之 的 后 面 是 第 1 个 元 素 。 
设置 两 个 指针 pl 和 p2，pl 必 向 第 一 个 元 素 ，p2 指向 第 -= 个 元 素 ， 操 知 它 们 是 否 相 等 。 如 果 
相等 就 属于 上 述 这 种 特殊 情况 。 如 果 不 等 ， 把 pt 向 后 移 个 元 素 ，p2 府 后 移 遇 个 元 素 。 检 
得 两 个 指针 的 值 ， 如 果 相 等 ， 说 明 链 表 中 存在 循环 。 如 果 不 相等 ， 继 续 按照 前 述 方法 进行 。 
如 林 出 驱除 个 指针 者 是 NULL 的 情况 ， 说 明 链表 中 不 存 丰 循环。 如果 链表 中 存在 循环 ， 用 这 
种 方法 肯定 能 够 检测 出 来 , 因为 其 中 一 个 指针 肯定 能 够 追 上 另 一 个 ( 鸯 个 指针 具有 机 问 的 什 )， 
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从 营 有 可 能 归 对 这 个 链 上 赤 经 过 儿 次 通 历 才能 检 凋 出 来 。 
这 个 问题 还 有 上 其它 一 些 答案 ， 介 上面 所 庶 的 几 个 是 报 稼 见 的 ， 


EIEIOAA RA A FE RS EI EN I IR warALLLNR as er 


编程 挑战 





寻找 循环 

证 明 上面 最 后 一 种 方法 可 以 检测 到 链表 中 可 能 存在 的 任何 箱 环 .在 链表 中 设置 一 个 循 
环 ， 演 练 一 下 你 的 代码 ; 把 循环 变 得 长 一 些 ， 继 续 演练 你 的 代码 . 重复 进行 ， 直 到 初始 条 件 
不 满足 为 止 。 同样 ， 确 定 当 链表 中 不 在 在 循环 时 算法 可 以 终止 . 

提示 : 编写 一 个 程序 ， 然 后 依次 往外 推演 ， 


RN VAR TANIA NINN a oviraar seoy 


A.3 人 语言 中 不 同 的 增值 语句 的 区 别 休 在 


考虑 下 面 川 条 语 们 : 


xX= XxX+1;} zx 正规 形式 */ 
++X 1 /* 前 缀 自 增 *7 
X+—} 让 后 缀 自 增 区 交 
XxX += 1) /+ 复合 赋值 */ 


显然 ， 这 四 条 庄 句 的 功能 是 相等 的 ， 它 们 都 是 把 x 的 值 增 加 1。 如 果 像 现在 这 样 不 总 由 
前 后 的 上 证 文 环境， 它们 之 间 并 没有 什么 区 别 。 应 试 省 需要 ( 风 式 或 显 式 地 ) 提 供 适 妆 的 上 下 
文 环 场 ， 以 便 回 答 这 个 问题 并 找 出 这 册 条 语句 之 间 的 区 别 。 注 意志 后 … 条 语 委 起 一 种 在 算法 
语言 中 表达 “x 等 十 x 训 _ 上 1” 的 便捷 方法 。 因 此 ， 这 条 说 名 仅 供 参考 ， 我 们 需 此 寻找 的 是 其 
余 三 条 语句 的 独特 性 质 。 

绝 大 多 数 C 程序 员 可 以 立即 指出 ++x 是 -种 前 纵 白 增 ， 当 它 先 增加 x 的 值 然 后 再 在 几时 
的 表达 式 中 使 用 x 的 值 。 而 x++ 是 一 种 后 缀 白 增 ， 它 先 看 周 周 的 表达 式 中 使 用 x 的 值 然后 再 
增加 x 的 值 。 有 些 人 认为 C 语言 存在 “++” 和 “--” 操 作 符 的 唯一 卡 因 是 *p++ 丰 PDP-11( 第 
-个 C 编 详 器 所 用 的 机 些 ) 机 器 上 可 以 用 一 条 单 ， -的 机 器 指令 来 表示 。 事 实 并 非 如 此 ， 这 个 特 
性 继承 了 PDP-7 上 的 B 语言, 但 自 增 利 白 减 操作 符 在 所 有 的 钙 件 系统 中 的 应 用 之 令 人 难以 
曾 信 。 

有 些 程序 员 贡 在 此 处 未 作 深入 考虑 ， 和 忽视 了 当 x 不 是 一 个 简单 的 变量 而 是 - -个 涉及 数组 
的 表达 式 时 ， 像 x+= 1 这 样 的 形式 是 很 有 有用 的 。 如 果 你 有 一 个 复杂 的 数组 引用 ， 并 党 要 证 明 
加 一 种 下 标 形 式 译 丙种 引 上 中 部 可 以 使 用 ， 那 么 

noae [上 1>>3] +: ~- (Cx01 << ( 1 & Ox7)); 
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就 是 你 应 该 采用 的 方法 。 这 个 例子 是 我 直接 从 操作 系统 的 代码 中 取出 来 的 ， 从 有 数据 名 
1 J 2 党 秀 的 应 试 少 还 能 够 指出 左 值 (定位 一 个 对 象 的 表达 式 的 编译 虎 用 
但 它 也 可 能 是 一 个 寄存 器 ， 也 可 能 是 地 址 或 宕 存 占 加 上 上 一 个 倍 段 ) 
Vs 次， 这 Re 因为 下 而 的 诗句 : 


mange:j++， += Y? 





» sz 有 
被 "1 作 
mancof i] = mango[li] ~ YY i+*; 
了 二 
而 人 不 是 
mangoli-+|] -= mangolit-| + Y; 


以 了 时， 当 我 们 对 -一 些 中 请 Sun 的 Pascal 网 详 器 队伍 的 位 普 的 焦 选 人 进行 面试 上 时， 最 好 的 
可 位 候选 人 (他 最 终 获得 了 过 个 工作 一 一 吵 ! Arindam) 解 释 尝 这 此 |x 别 与 编译 此 的 中 亲 代 侧 有 有 
关 ， 例 如 “++x” 农 示 上 眉 x 内 地 址 ， 增 加 它 的 内 容 ， 然 后 拒 值 放 在 寄存 内 中 :“x++” 则 表示 取 
x 的 地 址 ， 把 它 的 值 装 入 寄存 器 中 ， 然 后 增加 内 存 中 的 x 的 值 。 顺 伍 问 一 苛 ， 使 用 编 谋 论 的 
术 诸 ， 必 外 蚌 条 诸 句 应 该 怎么 描述 ? 

尽管 Kernighan 和 Ritchie 认为 日 增 操作 比 下 接 如 1 出 有 效 察 (K&R2, 第 18 页)， 企 日前 
所 使 用 的 当代 编译 器 通 向 在 这 方面 都 做 得 很 好 ， 使 这 几 利 方法 的 速度 痢 “ 样 。 如果 没有 任何 
能 够 显示 它们 之 间 区 别 的 相关 土 下 文 坏 境 , 现代 的 C 编译 堪 禁 纳 谋 这 些 语句 时 庶 该 产生 相 丘 
0 它们 记 a 种 措 令 。 你 可 以 什 扣 次 的 纺 渗 瞩 上 编译 这 些 代 

， 编 详 器 应 该 有 一 个 选项 ， 可 以 产生 个 汇编 指令 列表 。 你 也 可 以 把 编 详 器 设 幅 为 调试 横 
这 样 也 常常 可 以 使 检查 对 应 的 Cj 1 编 指 令 虽 为 容易 ， 不 要 使 玉 优 化 选 瑞 ， 因 为 这 
些 诺 名 有 可 能 因为 优化 而 被 精简 掉 。 在 Sun 的 工作 站 中 ， 附 上 神奇 的 厅 兄 “-S” 使 命令 行 看 
二 去 如 下 ; 

CC -S$ -Xo hanana. 

这 个 -S 选 天 使 编 详 停 在 汗 编 阶段 ， 把 汇编 语言 指 今 输 出 刘 banana.s 文件 中 。 最 新 的 编 详 
玄 SPARCompilers 3.0 作 了 改进 ， 当 使 用 这 个 选项 时 ， 它 可 以 使 源 代 码 散 布 上 汇编 程序 输出 
文件 中 。 这 碟 使 得 寻找 问题 和 诊断 代码 生成 变 得 更 加 容易 ， 

-Xe 选项 告诉 编译 器 扩 结 任何 不 符合 ANSIC 的 代码 结构 。 妆 编写 新 代 人 时 始终 使 用 这 个 
选项 站 一 个 好 主意 ， 因 为 它 有 助 于 程序 获得 最 大 程度 的 可 移 本性。 

所 以 ， 有 了 时候 区 别 就 在 于 哪 一 个 在 源 代码 中 看 上 去 更 好 一 点 。 一 般 较 短 的 形式 比较 长 的 
形式 出 容易 阅读 一 些 。 然而, 过度 简洁 也 会 导致 代码 难以 阅读 (你 只 要 问 问 那些 试图 收 改 其 它 
人 的 APL 代码 的 人 就 知道 了 )。 当 我 还 是 一 个 系统 编程 斌 究 生 班级 的 助教 时 ， -位 学 生 让 我 
看 - 些 代 砂 ， 他 说 代码 里 存在 个 未 知 的 Bug， 但 是 由 十 代码 过 于 紧凑 ， 所 以 无法 把 它 找 由 
米 。 在 一 些 高 年 级 C 程序 外 的 嘲笑 声 中 ， 我 们 系统 地 把 类 似 下 面 的 单行 代码; 

frotz[--j + I++] += --y; 
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扩展 为 切 能 相同 但 长 度 更 长 的 : 

ee = Erotz j+i; + y: 

这 让 帅 位 总 溉 玩弄 技巧 的 程序 员 凑 感 司 恼 ， 使 用 这 种 方法 ， 我 们 一目 池 就 发 地 其 中 个 
操作 位 壮 有 谋 。 

教训 ;， 不 要 在 一 行 代码 里 实现 太 多 的 功能 

这 各 做 法 并 不 能 使 缩 译 圳 产生 的 代 个 更 丰 效 率 ， 而 电 会 使 你 类 失调 试 代码 的 机 会 。 正 如 
Kernighan 利 Plauger 所 指出 的 那样 , “大 人 部 知 道 凋 试 比 第 一 次 编写 代 妇 要 礁 上 - 信 。 所 所 
上 泪 [ 朱 丰 编写 代码 时 把 自己 的 聪明 发 挥 到 极致 ， 那 么 在 调试 时 又 该 怎么 办 孔 ? ”| 


A.4 库 因数 调用 和 系统 调用 区 别 何在 


有 个 问题 我 们 时 常用 来 考察 侯选人 起 否 知 道 他 编程 的 方法 起 涯 简单 ,“ 库 了 数 谢 用 和 系 
Oe te te 我 们 开 不 曾 见 到 许多 
描述 这 个 区 别 的 书籍 ， 所 以 这 是 个 很 好 的 问题 ， 癌 以 判断 候选 人 是 否 共 有 永富 的 编程 经 验 以 
友 是 否 上 共有 找 出 这 类 问题 的 答案 的 敏锐 感觉 。 

简明 的 回答 是 函数 库 调用 是 语言 或 应 用 程序 的 一 部 分 ,而 系统 调用 总 操作 系统 的 部分、 
你 有 确保 开展“trap( 自 陷 ; ”这 个 关键 字 的 含义 ， 系 统 调 用 是 在 操作 系统 内 核发 现 “ 个 “trap” 
或 中 断后 进行 的 。 这 个 各 是 的 完整 答案 需要 覆盖 表 A-1 中 列 出 的 所 有 要 点 ， 














家 A-1 函数 库 调用 vs 系统 调用 
函数 库 调用 系统 调用 
在 所 有 的 ANSEC 编译 器 版 4 中 ，C 前 数 库 是 相同 | 各 个 操作 系统 的 系统 调用 是 不 i 的 。 
的 
它 调用 函数 亩 中 的 … 个 程 上 它 调用 系统 内 核 的 服务 
与 用 户 程序 相 联 委 是 操作 系统 的 一 个 进入 点 
在 用 户 地 址 空间 执 和 有 | 在 内 核 地 址 空间 执行 
它 的 运行 时 间 忆 于“ 用户” 时间 | 它 的 运行 时 间 届 于 “系统 ”了 k 贡 
局 十 过 各 调用 ， 开 销 较 小 和 要 在 切换 到 内 核 上 下文 环境 然后 切换 加 来 ,开销 较 
大 。 






在 C 函 数 库 jibc 中 有 大 约 30) 个 程序 不 UNIX 中 有 大 约 90 个 系统 训 用 (MS-DOS 中 少 :此 ) 


J 


Brian W.Kernighan 各 PJPlavger，The Elements of Progranming Stvte， 第 版 ， 第 10 贞 ， 组 二 ，McGraw-H 阳 ，1978， 产 10. 
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续 表 
函数 库 调 用 系 统 调 用 ee 
记录 二 UNIX OS 手册 的 第 三 省 记录 本 UNIX OS 丁 册 的 第 : 池 
典型 的 忆 晴 数 库 调用 ，system， fprintf，malloe 典 卉 的 系统 映 用 : chdir，fork，write，brk 


库 函 数 调用 遂 常 比 行 内 展 天 的 代码 慢 ， 内 为 它 击 要 付出 函数 调用 的 开销 ， 供 系 统 调用 比 
拱 消 数 调 用 还 小 慢 很 多 ， 因 为 它 诉 要 把 .上下文 坏 境 切 换 到 内 核 模式 。 人 在 SPARC 丁 作 站 上 ， 
我 们 对 一 个 库 聊 数 调 用 进行 记 时 ( 左 是 一 个 过 程 调 用 的 速度 )， 结 果 大 约 是 半 微 秒 。 系 统 调 川 
及 寄 柴 的 时 间 大 约 赴 库 消 数 调 川 的 70 倍 (35 微 落 ), 纯粹 从 性 能 上 考虑 ,你 应 该 尽 可 能 地 减少 
系统 滑 几 的 数量 但是， 你 必须 中 住 ， 许 匈 C 声 数 库 中 的 程序 道 过 系统 调用 米 实地 出 能 。 最 
后 ,那些 相信 碰 由 由 的 民 峰 的 .人 人们 会 对 system 人 站 函数 实际 上 起 一 个 床 清 数 这 个 松 念 感到 几 忒 。 


PIII I NINN NAO NN NN oemyamwmweahrrmvemsvmewsorrnv ee 


编程 挑战 


CRRA ER Se de a RE ET NA PE PE TED TT ORO oo MAA TS PE ASEAN eon 


Peris 教授 折磨 脑子 的 家 庭 作 业 
警告 ， 这 个 编程 挑战 对 于 有 些 读 者 可 能 过 于 艰巨 


有 些 研 究 生 学 校 也 使 用 编程 问题 来 测试 它们 的 新 生 。 在 耶鲁 大 学 ，Alan Perlis 教授 
(Algol-60 的 创始 人 之 一 ) 曾 用 下 面 的 作业 (要 求 一 星期 内 完成 ) 测 试 他 刚 入 学 的 研究 生 ， 

为 下 到 各 个 问题 编写 程序 : 

1. 读 取 一 个 字符 囊 ， 放 输出 它 里 面 字符 的 所 有 组 合 ， 

2.“ 八 皇后 ”问题 (假设 棋盘 上 有 八 个 皇后 ， 要 求 打 印 所 有 使 八 个 皇后 不 会 互相 攻击 的 
棋子 配置 ) 

3. 给 定 一 个 数 N， 要 求 列 出 所 有 不 大 于 N 的 素数 . 

4. 编写 一 个 子 程序 ， 过 行 两 个 任意 大 小 的 矩阵 节 法 运算 

研究 生 们 可 以 司 用 下 页 语言 之 一 : 

BC 

2. APL 

3. Lisp 

4. Fortran 

上 述 几 个 编程 问题 作为 研究 生 的 作业 ， 让 每 位 学 生 接 受 一 项 任务 还 是 比较 合理 的 ， 但 现 
在 我 们 被 要 求 在 一 个 星期 之 内 究 成 所 有 的 任务 ， 我 们 中 的 有 些 人 甚至 从 来 没有 用 过 上 述 四 种 


语 后 ， 
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当然 ， 我 们 并 不 知道 Perlis 教授 实际 上 只 想 考 考 我 们 ， 事 实 上 他 并 不 打算 捉 和 再 任何 一 个 
人 ， 绝 大 部 分 新 研究 生 都 记过 了 演 和 狂 的 一 周 ， 时 至 深夜 依然 姜 在 电脑 终端 时 ， 只 是 为 了 完成 
这 些 折 磨 脑子 的 任务 。 名 到 班 上 后 , 教授 要 求 自 感 者 在 黑 扳 上 演示 单个 语言 /问题 的 组 合 方 委 ， 

有 有些 问题 可 以 被 一 些 习惯 用 法 解决 ， 比 如 问题 3 就 可 以 用 一 行 APL 代码 | 解决 

(2=+.0=TE .17) /+ .N 

这 样 ， 如 果 谁 完成 了 这 些 作业 的 任何 一 部 分 ， 都 有 机 会 进行 展示 。 那 些 被 问题 所 难 倒 ， 
哪怕 一 小 部 分 也 没完 成 的 人 会 意味 到 他 们 可 能 冯 不 适合 读 这 个 研究 生 ， 这 是 疯狂 且 巨 忙 的 一 
周 ， 我 在 这 段 时 间 里 学 习 到 的 APL 或 LISP 的 知识 比 以 前 几 年 以 及 以 后 几 年 里 加 起 来 学 到 的 
还 要 多 ， 


Er MA ren FA ER sur 





A.5 文件 描述 符 与 文件 指针 有 何不 同 


这 个 问题 是 前 面 “个 河 题 的 自然 延 综 。 所 有 操纵 文件 的 UNIX 程序 或 者 使 用 文件 指针 
或 者 使 用 文件 描述 符 来 标识 它们 止 在 操作 的 文件 。 它 们 是 什么 ?什么 时 候 应 该 使 用 ?事实 上 上 
答案 非常 六 截 了 汝 ， 它 取决 于 你 对 UNIX IO 的 熟悉 程度 以 及 对 各 种 因素 利 灼 的 权衡。 

描 有 操纵 文件 的 系统 调用 都 接受 一 个 文件 洪 述 符 作为 参数 ， 或 者 把 它 作为 返 四 人 返回。 
“文件 描述 符 ” 这 个 名 字 允 少 显 得 有 点 命名 不 当 : 在 Sun 的 编 详 吕 中， 文件 描述 符 是 一 个 小 
整数 (通常 人 在 0-255 之 间 ) 用 于 索引 地 放 文 件 的 每 个 进程 去 (per-process tabie-of-open-files)。 系 
统 IO 调用 有 creat(0, open' ,read()， write0, close(, ioctl0 等 ， 但 它们 不 是 ANSIC 的 -部 分 ， 
个 会 存在 于 韭 UNIX 区 境 。 如 果 你 使 用 了 它们 ， 你 的 程序 将 失去 可 移植 性 、 内 此 ， 建 立 : -组 
标准 WO 库 调 用 是 必要 的 ，ANSIC 现在 规定 所 有 的 编译 环境 都 必须 支持 它们 

为 了 依 保 程序 的 可 移 午 性， 应 该 使 用 标准 WO 上 库 调 用 ， 如 fopen(), felose(), pute(). fssek() 
等 一 一 它们 中 的 绝 大 多 数 .名字 中 带 有 一 个 “f?”。 这 些 调用 部 接受 一 个 类 型 为 指向 FILE 结构 的 
站 针 (有 时 称 为 流 指针 ) 的 参数 。FILE 指针 指向 - ` 个 流 结构 ， 它 在 <stdjo.h> 中 定义 。 结 构 的 内 
容 根据 不 癌 的 编译 器 有 所 不 同 ， 在 UNTX 中 通常 是 开放 文件 的 每 个 进程 表 的 一 个 条 目 。 人 在 由 
地 情况 下 ， 它 包含 了 流 缓冲 区 、 所 有 用 于 提 砂 缓冲 区 中 有 有 多少 字 节 是 实际 的 文件 数据 的 变量 
以 及 提示 流 状态 的 标志 ( 丰 ERROR 和 EO) 等 。 

”所 以 文件 描述 符 就 是 开放 文件 的 每 个 进程 表 的 - -个 偏 移 量 ( 如 “3”)。 它 用 于 UNIX 
系统 调用 中 ， 用 于 标识 交 件 。 

” FILE 指针 保存 了 一 个 FILE 结构 的 地 址 。FILE 结构 用 于 表示 于 放 的 VO 流 ( 如 hex 
20938)。 它 用 于 ANSIC 标准 IO 库 调 用 小 ， 朋 于 标识 文件 。 

C 库 消 数 旭 open0 可 以 用 于 创建 一 个 新 的 FILE 结构 ， 并 把 它 与 - -个 确定 的 文件 描述 符 相 
关联 (可 以 右 效 地 在 文件 杆 述 符 小 整数 和 对 应 的 流 指 针 间 进行 转换 , 虽然 它 并 不 在 开放 文件 表 


” 你 坝 在 本 以 明 自 为 什么 不 存在 “ 祷 瑟 APL 代 匀 大赛”， 因 为 之 们 本 身 己 经 六 混 乱 的 了 了 。 
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中 产生 一 个 额外 的 新 条 朋 ， 


A.6 编 伍 - 些 代 仔 ， 傅 定 一 个 变量 是 有 符号 数 还 是 无 符号 数 


三 ne Mierosoft 春 试 时 ， 基 中 一 个 司 | 目 就 是 * 编 习 一些 代 硬 ， 山 十 一 个 党 哩 
是 有 符 写 数 偿 是 无 符号 数 ” 这 实际 上 个 相当 淮 的 问题 , 因为 管 留 下 了 大 多 的 宝 间 让 你 去 
由 和 解 这 个 同 题 ， 自 此 大 镜 识 地 把 “有 有 简 : F 数 ”共有 作 写 ”等 回电 来 ， 以 为 这 个 问题 量 帘 
束 一 个 小 小 的 轴 数 或 罕 ， 测 滤 安 民 的 值 二 可 小 本 汰 就 时 以 了 ， 

问题 让 然 没 有 这 么 简明 。 虐 回答 这 个 问题 ， 你 忆 贷 在 竺 定 的 编译 融 遇 和 确 一 个 给 定 和 的 类 
型 是 有 行车 数 还 必 无 符 条 数 。 在 ANSIC 中 ,char” 瞩 可 以 是 在 符号 数 ， 下 同 以 是 无 符号 烙 ， 
过 是 出 编 主 此 决 定 的 :站 你 纳 到 的 代 合 计时 移 寻 到 多 个 于 有 时 、 知 这 类 型 起 在 是 有 人 符 好 元 吕 
在 六 有 用 了 ， 姐 果 访 类 型 卉 所 有 的 编译 器 网 译 时 都 是 眉 定 的 ， 于 就 条 理想 不 过 了 了 。 

你 碟 法 出 国 数 实现 明了 的 ， 国 数 形 式 参 数 的 类 型 是 在 中 数 内 部 定义 的 ， 所 以 它 无 法 穿 加 冲 
用 这 -一 六 ， 办 此 ， 你 必须 编写 个 宏 ， 根 据 人 参数 的 店 骨 对 它 进 行 处 理 ， 

接 下 米 号 是 区 别 安 的 天数 到 底 是 一 个 类 型 述 起 … die 假定 参数 是 “个 值 ， 无 位 
写 数 的 本 邮 特征 是 它 永 远 不 会 是 贫 的 ， 有 符号 数 和 的 本质 特征 是 对 基 左 边 个 位 取 补 将 会 改 恋 
它 的 答 与 (比如 2 的 引 码 表 坟 ， 它 寺 定 是 个 全 数 )。 吊 | ee 这 个 油 
试 无 关 ， 你 可 以 对 它们 父 前 到 补 ， 结 果 丰 一 样 的 、 央 此 ， 可 以 像 下 出 这 样 答 试 : 

上 可 Sne TSUNSIONEL :ia) IE >=0 && “a i 0 

弛 玉 宏 的 参数 是 一 个 打 型 ， 其 中 一 个 方法 是 使 用 类 型 转换 ， 

Hdeiine TSUNSICNEL (tyEe) (({tLypeld - | » 0) 


硬 试 的 关键 就 在 于 正确 理解 问题 5! 你 需要 人行 细 地 昕 ， 如 果 不 理 解 问 昨 或 者 觉得 它 鸣 涯 义 
不 渍 ， 可 以 要 求 一 个 下 好 的 解释 、 第 一 个 代码 例子 上 只 适 肯 于 K&RC， 新 前 类 型 提升 规则 导 敏 
它 无 法 适用 寺 ANSIC。 练 亲 : 解释 -个 为 什么 ， 并 提供 一 个 适用 十 ANSIC 的 经 决 方 染 . 

Microsoft 的 绝 大 部 分 站 题 部 想 考 察 你 在 压力 下 能 够 怎样 思 状 问题 ， 伍 它们 六 不 部 是 技术 
性 的 ， 一 人 上 典型 的 非 技术 性 问题 可 能 是 “美国 一 共有 多 少 个 加油 站 ? ”或 “美国 其 有 有 多少 
个 理发 店 ? ”他 们 想 乔 看 你 是 理 作 出 正确 的 猜测 和 合计 ， 或 者 能 够 提供 一 种 守 找 业 可 靠 答 案 
的 好 方法 。 建议 ; 打 电 话 给 各 个 州 的 执照 发 放 机 构 ， 只 要 50 个 电话 ， 你 让 可 以 甘 得 淮 确 的 数 
祝 。 或 者 ， 你 也 中 以 选 六 七 个 有 代表 性 的 州 ， 根 据 样本 推 项 出 总 体 数 生 。 你 甚至 厢 以 像 位 
环保 十 义 背 那样 问答， 当 被 名 友 “美国 有 多 少 个 加 油 站 时 ”时 ， 她 生 半 地 回答 :“ 太 狂人 


A.7 打印 一 棵 一 叉 树 的 值 的 时 间 复 杂 度 是 多 少 


这 个 何 题 是 面试 者 在 中 请 Intel 编译 器 小 组 的 -个 名 位 时 被 问 到 的 ; 虞 在 ， 关 于 复 茶 度 却 
论 首 先 需要 知道 的 是 人 O 表示 法 ，O(N) 表 示 当 N( 道 常 起 主要 处 理 的 对 象 数 量 ) 增 长 灶 ， 处 到 
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时 间 儿 平 是 按照 线 性 增长 的 。 类 似 ，D(UN) 赤 未 汉 N 增长 时 ， 处 弄 有 时间 的 增长 要 快 得 多 ， 关 
姓 是 按 赂 有 的 平方 撒 长 的 : 闫 本 复杂 度 理论 你 此 次 入 要 旬 道 的 是 在 一 栋 - 义 树 由 ， 所 有 的 控 
和 作 的 时 亲 复 杂 度 都 是 O(log{n))， 所 以 ， 很 多 程序 员 不 候 忠 索 地 作出 了 这 个 回答 。 错 误 ! 


这 个 问题 有 点 类 似 于 .Dan Rather 浇 台 的 “频率 是 什么 ?Kenneth ”问题 -一 - 这 个 问题 用 二 
十 扰 、 沅 淆 和 激怒 对 六 而 不 是 真 的 门 对 方 资 询 情 息 ， 要 打印 一 柑 : 浆 树 所 有 结 点 的 车 ， 你 必 


须 对 筷 们 逐个 访问 ， 所 以 时 间 复 杂 度 为 O(N)。 

我 的 一 些 同 事 企 接受 嵌 普 公司 电子 工程 师 开 售 的 身 试 时 ， 也 过 到 了 类 似 的 隐 阱 问题 : 这 
个 问题 是 : 在 -个 理想 的 没有 阻抗 的 下 路 中 ,个 充 了 所 的 电容 器 和 :个 未 充电 的 电容 器 突 
然 接触 在 超时， 会 发 生 什 么 情况 ? 机 械 上 工程 崭 陪 位 的 看 试题 则 是 两 枢 质 灵 名 略 不 让 的 室 签 
从 平衡 位 置 拉 紧 ， 然 后 松 :T 会 发 生 什 么 ?主考 守 分 别 运 用 黄 个 不 同 的 物理 定理 〈 旭 电 容器 例 
和 子 中 电 碍 守恒 定理 和 能 量 守 恒定 惠 ) 推导 出 是 个 不 同 的 结论 ， 然 后 他 询问 丰 试 者 为 什么 会 掉 
现 两 种 不 同 的 结果 ? 了 原因 付 在 ? 

这 时 的 陷阱 件 于 主考 官 全 少 在 表达 共 中 一 个 结论 时 使 用 了 一 -个 市 殷 了 初始 条 件 和 结束 条 
件 的 积分 公式 。 在 现实 性 界 中 ， 这 确实 没 错 ， 但 在 理论 性 的 实验 站 ， 它 导 敏 了 对 不 连 续 状 态 
的 积分 ( 负 为 减速 效果 被 理想 化 了 )， 这 样 ， 这 个 公式 不 硒 适 用 ， 工程师 很 可 能 以 狐 从 来 没 太 
健 到 过 这 类 问题 . 但 是 ， 这 些 类 似 无 质量 弹 昔 和 和 碟 阴 抗 电路 的 问题 保 深 六 你 冰 二 星 邦 会 使 你 
难堪 ! 

但 是 ， 应 试 者 在 中 请 -一 家 人 蜡 管 理 咨询 公司 的 … 个 软件 显 问 脱位 时 ， 正 着 密 又 扼 出 了 昂 
一 个 昕 线 球 ， 问 题 是 “如 时 execve 系统 调 败 成 巧 ， 它 将 挨 加 什么 ? ” 癌 磊 … 卜 ，exevef] 岳 数 
用 参数 中 的 可 执行 文件 殖 换 调 川 者 进程 的 映像 并 开始 执行 所以， 六 execve 系统 调用 成 功 执 
行 后 ， 它 并 不 会 返回 一 个 位。 把 这 些 陷 噶 问 题 几 十 习 难 你 的 朋友 人 确实 很 有 趣 ， 介 如 果 在 面试 
小 遇 到 它们 就 不 大方 趣 了 。 


A.8 从 文件 中 随机 提取 一 个 字符 串 


这 也 是 Microsoft 喜欢 使 用 的 问题 之 一 . 上 考 官 耿 求 面试 埋 编 号 一 些 代码， 实现 从 个 文 
伯 ( 文 件 的 内 容 是 许多 字符 串 ) 中 随机 提 皮 一个 字符 串 。 解决 这 个 问题 经 典 的 方法 是 读 取 文件 ， 
对 字符 串 进 行 计数 ， 并 记录 每 个 字符 串 的 偏 移 位 置 。 然 乒 ， 在 1 和 字符 串 总 数 之 说 收 ， 个 随 
机 数 ， 和 根据 选中 仓 符 中 的 偏 移 位 置 取 出 该 字符 串 。 

但 是 ， 主 考官 设置 了 ，- 些 条 件 ， 使 这 个 问题 的 难度 人 大 增加 。 他 要 求 只 能 按 晨 序 浪 上 文 
件 -一 次 ， 并 且 不 能 使 用 皮 格 来 存储 所 有 字符 串 的 仿 移 位 置 。 对 于 这 个 问题 ， 上 主考 官 的 主要 兴 
趣 在 于 你 如 何 解 决 问题 的 过 程 。 如 果 你 提问 ， 他 会 给 你 ， 些 提示 ， 所 以 人 多 数 面 试 阁 最 终 都 
能 获得 答案 。 证 考官 对 你 的 满意 程度 取决 于 你 关 得 答案 的 速度 。 

基本 的 技 瑟 是 在 事 存 的 学 符 串 中 挑选 ， 并 在 过 程 中 不 断 喝 新 。 从 计算 的 角度 看 这 个 方法 
是 非常 低 效 的 ， 所 以 它 很 容易 被 忽略 ， 你 打开 文件 并 保存 第 一 个 字符 出， 此 时 就 丰 子 -- 个 备 
选 学 符 中 ， 并 有 100% 的 可 能 性 达 中 它 。 保 存 这 个 字符 刍 ， 继 续 访 入 下 一 个 字符 串 ， 这 样 就 
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有 了 两 个 备 选 下 符 由， 选中 每 个 的 可 能 性 都 是 50 够 : 选 路 其 中 之 并 保存 , 然后 天 齐 曙 一 个 
骨 读 入 下 个 学 符 串 ,按照 新 学 符 串 33% 硕 先 圣 存 的 字符 帅 67 儿 的 概 闪 ( 它 代表 前 两 个 宇 符 串 
的 章 存 着 )， 在 两 省 之 加 选 搓 一 个 ， 然 后 和 尔 存 新 选中 的 字符 出。 

根据 这 个 上 方法， 依次 对 整个 义 件 进行 处 理 。 在 共 中 每 ~… 步 ， 读 入 学 符 串 N， 布 它 { 按 昭 
IN 的 概率 ) 和 前 一 个 六 在 的 字符 中 ( 按 明 N-LAN 的 概率 ) 之 辣 进 行 选择 。 当 刘 达 交 件 林 堪 的 时 
候 ， 最 后 一 个 幸存 的 字符 串 就 是 从 整个 文件 中 随机 提取 的 焊 个 字符 由 ! 

这 是 一 个 非常 疹 难 船 门 题 ， 你 要 么 依靠 尽 可 能 少 的 提示 获得 答案 ， 要 么 就 预先 做 好 充分 
准备 ， 提 前 阅读 本 书 。 


A.9 轻松 一 下 一 一 如 从 用 气压 计 测 量 建筑 物 的 高 度 


我 们 觉得 这 些 问 题 乐 起 无 穷 ， 其 至 偿 把 它们 应 用 到 白 己 的 非 计 算 机 环 菩 中。Sun 有 -个 
出 “junk mail” 的 e-mail 帐号 ， 让 员工 们 共享 偶然 兴 之 所 致 得 到 的 灵感 有 时 候 ， 大 们 把 问 
题 放 到 这 个 帐 妃 中 ， 并 要 求 其 它 .工程 师 进 行 比赛 ， 提 交 最 佳 答案 。 这 里 误 有 这 样 “个 驮 题 ， 
它 是 最 近 才 放 上 去 的 。 

人 有 一 个 很 早 的 故事 ， 讲 的 是 一 位 物理 系 学 生 导 找 新 闸 的 方法 用 气压 计 测量 “一 幢 建 筑 物 的 
测度 。 Alexander Calandrain 伯 The Teaching of Elementary Science and jarhemaarics! 中 引述 了 这 


个 故事 。 


一 位 学 生 考试 被 判 不 瓦 格 ， 因 为 他 拒绝 使 用 班 上 老师 所 教 的 方法 回答 问题 。 当 这 名 学 生 
提出 抗议 时 ， 学 校 指 定 我 担任 仲裁 人 。 我 来 到 教授 的 办 公 室 ， 阅 读 了 考试 题 “怎样 在 气压 
计 的 帮助 下 测量 一 幢 高 楼 的 高 度 。” 

这 位 学 生 是 这 样 回答 的 : “把 气压 计 带 到 楼 项， 用 一 个 长 绳 系 住 。 把 气压 计 放 低 ， 直 到 
触及 街 面 ， 然 后 再 提起 来 ， 测 量 绳子 的 长 度 。 绳 子 的 长 度 就 是 建筑 物 的 高 度 .” 

离 分 的 回答 应 该 是 充分 运用 物理 学 的 原理 ， 但 这 个 回答 显然 没 说 明 这 一 点 .我 提议 给 这 
位 学 生男 一 次 机 会 回答 这 个 问题 。 我 给 了 这 位 学 生 6 分钟 时 间 ， 并 警告 他 答案 必须 与 物理 学 
的 知识 有 关 . 结果 他 只 用 了 一 分 钟 就 交 上 了 答案 : “把 气压 计 带 到 楼 项 ， 倚 在 屋顶 的 边缘 上 ， 
然后 放 开 气压 计 ， 并 用 秒表 进行 计时 。 然 后 ， 运 用 物体 下 险 公 式 : 5=1/2 a f 计算 建筑 物 的 高 
度 。 ”此 时 ， 我 毫 不 犹 耶 由 给 了 这 位 学 生 满 分 ， 

这 位 学 生 继 续 说 出 了 3 种 运用 气压 计 测 量 建筑 物 高 度 的 方法 : 

在 阳光 灿烂 的 日 子 里 ， 测 量 气压 计 的 高 度 、 和 气压 计 影 子 的 高 度 以 及 建筑 物 影子 的 高 度 ， 
然后 运用 简单 的 比例 原理 ， 计 算出 建筑 物 的 高 度 。 

带 上 气压 计 走 上 建筑 物 的 楼 梯 。 当 你 卜 楼 梯 时 ， 用 气 正 计 的 高 度 在 墙 上 作 标记 ， 到 达 楼 
顶 后 ， 数 一 下 标记 的 数量 ， 你 就 可 以 得 到 以 气压 计 高 度 为 单位 的 建筑 物 高 度 ， 

最 后 一 种 方法 (也 许 最 工 可 行 ) 是 把 气压 计 送 给 建筑 物 的 管理 员 ， 让 他 告诉 你 建筑 物 的 高 
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妆 这 个 老 振 让 的 故事 作为 “个 “科学 礁 题 ”出 现在 Sun 时 ， 人 们 又 重新 激 起 了 对 它 的 热 
情 ， 总 共 提 出 了 16 种 新 的 导 气 计 订 测 旦 建筑 物 祝 嵌 的 好 方法 。 这 些 方法 如 下 : 

气压 法 :分 别 测量 楼 而 和 楼 底 的 气压 ， 然 后 根据 气 床 差 计算 大 屡 的 高 度 。 这 个 方法 是 这 
个 问题 最 初 没 计时 的 标准 答案 ， 也 是 测量 大 楼 总 度 最 不 精确 的 方法 之 -。 

钟 摆 法 ， 米 到 建筑 物 的 项 部 ， 用 绳子 系 住 气压 计 ， 拒 它 放 低 到 地 而。 然后 嘻 动 气 庆 计 ， 
测 旦 钟 朱 的 摆动 时 间 ， 根 据 朱 动 时 间 可 以 计算 出 钟 摆 的 长 度 ， 也 就 是 建筑 物 的 高 度 。 

贪 构 法 ， 把 气 诗 计 当 担 ， 换 取 一 点 种 子 基 命 。 然 后 用 连锁 信 方 法 或 称 神秘 链 方法 ) 积 
崇 - 大 笔 钱 ， 把 这 笔 钱 堆 得 和 大楼 - 样 点 ， 然 后 根据 伴 张 纸币 的 厚度 和 纸币 的 张 数 计算 大 楼 
的 遍 度 。 六 个 方法 并 没有 提 及 如 何在 警察 朗讯 赶 来 之 前 完成 对 大 楼 的 测量 。 

黑手 党 法 ， 用 气压 计 仁 为 武 占 ， 威 退 大 楼 的 管理 贡 说 出 大 楼 前 黄 度 。 

弹道 法 ， 在 地 徊 .上 用 一 哥 扎 市 炮 把 气压 计 送 上 兴 室 ， 让 它 下 好 到 达 楼 项 的 高 度 。 你 可 能 
需要 进行 几 次 距离 修正 发 射 以 获得 刚好 能 把 气压 计 送 公 大 楼 高 度 的 发 射 方法 。 运 用 标准 暗道 
计算 表 ， 你 可 以 计算 出 这 这 弹道 发 射 的 高 度 ， 也 就 是 大 楼 的 高 度 。 

镇 纸 法 : 拒 气 床 计 作为 镇 纸 压 在 建筑 物 设计 图 纸 ， 然 后 从 图 纸 玫 找 出 建筑 物 的 高 度 ， 

音速 法 : 从 大 楼 的 项 部 把 气压 计 扫 下来， 温 量 气 厂 计 接 击 地 面 得 你 听 到 拉 击 上 志 的 时 间 差 。 
在 实际 可 行 的 距离 内 ， 视 觉 传递 的 时 间 可 以 忽略 不 计 ， 天 声音 的 传递 速度 (在 标准 温度 和 气 扑 
条 件 下 是 340m's) 是 已 知 的 ， 根 据 上 面 这 此 数据 可 以 计算 出 大 楼 的 高 度 。 

反射 法 ， 把 气压 计 的 玻璃 面 作为 镜子 ， 测 量 镜面 反射 亮光 从 楼 质 到 地 面 的 米 回 时间 ， 由 
于 光 的 速度 是 一 个 己 知 旺 ， 所 以 大 楼 的 高 度 也 可 以 据 此 测 出 。 

商业 法 ， 卖 掉 气 斥 计 ， 用 这 笔 钱 买 -- 些 适当 的 仪器 测量 大 楼 的 高 度 ， 

类 比 法 ;用 一 根 弹子 汇 住 气压 计 ， 把 绳子 绕 在 -个 小 型 发 电机 的 轴 上 。 然 后 把 气 不 计 从 
人 楼 项 十 扔 下 来 , 绳子 就 会 使 发 电机 转动 。 测量 气 庄 计 从 楼 项 掉 到 地 面 期 间 发 电机 所 发 的 电 ， 
发 电机 产生 的 电能 和 铀 旋转 的 固 数 是 成 正比 的 ， 根 据 这 些 数据 可 以 算出 楼 顶 剑 地 出 的 高 度 。 

三 角 法 :在 地 面 .上 选 一 点 ， 它 和 大 楼 的 距离 是 已 知 的。 带 上 气压 计 和 -个 量 角 器 来 到 大 
楼 的 硕 部 ， 等 等 太阳 到 达 水 平 线 。 然 后 ， 把 气 玉 计 当 作 和 镜子， 把 一 束 日 光 引 人 到 先前 所 设 定 的 
地 点 ， 用 量 角 器 测 晤 气压 计 的 角度 ， 然 后 用 三 角 学 原理 计算 大 楼 的 高 度 。 

比例 法 ， 测量 气 压 计 的 高 度 。 叫 一 个 朋友 ， 并 带 上 一 把 卷 以 。 趴 在 大 屡 外 已 知 中 内 的 
一 点 ， 气 压 计 放 在 你 和 大 楼 之 间 ， 调 整 气压 计 的 位 置 ， 从 你 看 上 去 气压 计 上 端 止 好 与 楼 融 
相 下 。 

然后 叫 你 的 期 友 测 基 ' 祭 的 眼睛 距离 气压 计 鸭 距离 ,最 后 根据 比例 原理 计算 出 大 楼 的 高 度 。 

照相 法 ， 从 大 屡 外 己基 距离 的 地 点 支 起 三 角 架 ， 架 上 是 照相 机 。 然 后 把 气压 计 放 在 与 照 
相机 距离 已 知 的 地 方 ， 拍 下 熙 片 。 根 据 照片 中 气压 计 和 大 楼 的 相对 高 度 ， 你 可 以 计算 出 人 楼 
的 实际 总 度 ， 

重力 法 1 : 用 长 绳 系 生 气 讨 计 ， 从 大 楼 上 挂 下 来 直到 地 面 。 浏 盟 钟 探 的 摆动 时 间 ， 和 根据 
冬 力 加 速度 的 差别 计算 出 大 楼 的 高 度 。 

283 


C 专家 编程 

重力 法 芽 ， 在 大 屡 的 下 部 利 底部 分 草 用 弹 赣 年 测量 气压 计 的 再 量 (不 能 用 天平 释 )， 了 机 个 
恒基 应 该 有 所 其 别 ， 这 是 庄 十 重力 加 速度 的 巷 异 引起 的 。( 一 位 读 洛 告诉 我 Lacoste Romberg 
重力 计 能 够 提供 准确 结果 亡 震 要 的 精度 ) 你 可 以 根据 这 酚 信 读数 计算 出 大 楼 的 肯 度 。 

卡路里 法 : 把 气球 让 从 楼 顶 扔 下 来 ， 折 到 地 面 :个 装 有 水 的 赛 占 里 。 容 堪 的 开口 度 信 最 
小 ， 尽 可 能 防 呈 水 的 活 出 。 水 温 的 升 态 是 气 奈 计 的 机 械 能 转换 为 热能 的 结果 ,根据 水 温 秆 匣 
的 度数 本 以 计算 出 气压 计 租 达 地 遇 的 势能 ， 进 一 步 杆 以 计算 出 大 楼 的 高 度 。 

你 是 不 想 认 为 这 样 的 问题 只 会 外 代 数学 里 出 纲 。 


A.10 更 多 阅读 材料 


各 果 休 如 欢 本 蔬 ， 你 串 能 也 会 喜欢 Bartholomev and the Oobleck, 作 疹 是 Seuss 同上 (纽约 ， 
Random House, 1973}, 

Seuss 博士 解释 说 ，Oobleck 就 是 “ 举 头 人 小 的 财 状 物 ， 表 咖 光 滑 ， 就 像 症 用 橡皮 制作 的 
十 如 国 玫 ”人 他 没有 说明 册 何 制造 它 ， 所 以 我 在 这 里 提供 了 -种 方法 ， 

如 何 制造 Oobleck 

1. 坊 一 村 玉米 淀粉 。 

2， 加 儿 滴 绿色 的 食用 色素 ,Oobleck 的 颜色 总 是 绿 的 。 

3，~ 边 加 水 ， - 边 缓 织 捏 制 洗 粉 盎 ， 总 共 大 约 加 六 村 水 。 

Oobleck 有 一 些 极端 疝 翌 ， 不 符合 牛顿 定律 的 属性 。 它 像 水 一 样 流 过 你 的 指 尖 ， 除 于 人 
把 它 挤 成 财 一 一 它 会 立即 保 撞 回 体 的 坚 半 性。 如果 售 小 搓 捏 ， 它 又 会 变 加 液 沪 。 则 果 用 局 
物 快速 市 打 它 ， 它 就 会 被 击 碎 ! 

和 Seuss 博士 的 所 有 从 一 样 ， Bartholomey and the Oopleck 可 以 从 好 几 个 层次 了 上 上 阅读 和 欣 
党 ,例如 ，One Fish Tiwo Fish, Red Fish Blue Fish dj 以 被 分 解 为 思维 单一 的 ..- 进 制 计 数 系统 的 
重油 控诉 。 软 件 上 上 程 师 如 果 细 心 哆 读 Bartholomey and the Oobleck， 肯 定 能 从 中 效益 。 

如 果 和 人 每 位 程序 只 只 是 龟 尔 玩弄 Oobleck， 这 个 世界 显得 会 美好 许多 。 优 秀 的 程序 员 将 会 
休 起 得 更 好 ， 精 力 更 加 充沛 ， 而 鳖 脚 的 程序 员 则 很 汕 能 困 得 脑袋 常常 和 上 拒 子 打 保 。 但 是 ， 始 
终 应 该 记 住 ， 匹 论 你 是 一 位 极其 平 上 凡 的 程序 员 ， 还 是 一 位 广 受 赞 祥 的 天 才 高 手 ， 你 都 中 宇宙 
的 “个 手 进 程 ， 跟 磁 自 控制 器 或 者 堆栈 活动 记 殿 (第 和 6 章 详 细 介 绍 ) 没 什么 两 样 。 

据 访 当 你 两 眼 将 深 地 谋 视 深渊 时 ， 深 湖 也 同样 此 视 着 你 。 但 起 ， 如 果 你 深 深 地 凝视 本 了 ， 
炎 然 并 不 十 分 优雅 ， 史 外 你 很 可 能 患 有 头痛 或 其 它 次 患 ， 

我 无 法 想象 ， 除 了 计算 机 编程 之 外 ， 或 还 能 做 些 什 么 十 作 。 在 所 有 的 日 子 里 ， 你 从 虚幻 
中 创建 模式 和 结构 ， 并 顺便 解决 数 十 个 小 问题 。 人 脑 的 聪明 和 天 才 被 挫 在 电脑 的 高 速 和 准确 
Ts 

事实 就 站 如 此 。 人 类 的 最 高 日 标 是 奋斗 、 娃 求 、 创 造 、 铬 位 程序 员 孝 应 该 寻找 并 抓 住 每 
次 机 会 ， 鸽 月 已 …… 哇 ! 写 得 太 多 了 。 
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附录 B 


Symbol 符 写 
#define 
Numerics 数字 


32 位 地 址 
64 位 地 址 


32-hit address 
64-bit address 


A 


a.out 

ABI 

actual parameter 
Ada 

Algol-60 
Algol-68 
alignment 对齐 
alloca 

angst 上 烦恼 
ANSIC 
ANSIC Standard ANSIC 标准 
APL 

arena 竞技 场 


实际 参数 ， 实 参 


argument 
arity 
array initialization 数 纽 初始 化 
arrayfpointer equvalence “数组 /指针 相等 性 


术语 表 


array/pointer interchangeability 数组 /指针 同 
交换 性 


assienment OPeratGT 
结合 性 


复合 赋值 符 
associativity 
auto 

autontatic ”自动 的 
availability 可 用 性 


[2 

B 

back end 后 端 

barometriec building measurement 用 气 上 正法 
测 晤 建筑 物品 谋 

BASIC 

BASIC interpreter BASIC 解释 由 

BCPL 

BIOS 

block 块 


blocking read 阻 吐 性 读 取 
Bobrow, Daniel 

Borland 

boss key ”老板 键 

Bourne shell 

Bourne, Steve 

break 


BSS segment BSS 段 
bus etrror 总 线 错 谈 
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C 


C+ 十 

cache 

call-by-reterence 和 传 引用 调用 

call-by-value ” 传 值 调用 

Camegie-Mellon University 卡 峙 基 - 橙 降 大 


2 

cast 强制 类 型 转换 
catalpa 

cdecl 

class 类 

COBOL 

code generator 代 公 生成 器 
COFF 


Coke machine 可乐 机 

column major addressine “ 列 主 序 编 址 
编译 器 驱动 器 

复数 

条 件 操作 符 
致 性 数组 


compiler driver 
complex-number 
conditional operator 
conformant arrays 
conforming ”遵循 


const 
constant “常量 
constraint ”限制 


constructor 构造 函数 
context Switch 上 上 下文 切换 
core dump ”信息 转 储 
corruption 损坏 

CP/M 

curses library eurses 函数 库 


D 


悬垂 指针 


dangling pointers 
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data segment 数据 上段 
Dead Computers Society 处 亡 计 算 机 协 会 
debugger hook 
声明 
谨 明 器 
definition 完 义 
析 构 届 数 
甘 接 声明 器 


declaration 
declarator 


destructor 
direct_declarator 
显 不 
Doctor 程序 

dope vector dope 向 量 

氏 动 秦 程 序 
dynamic data structure ” 牙 仿 数据 结构 
dynamic jinking 动态 链接 


display 
Doctor 


driver program 
dynamic arrays 


EkE 

王 .IE.1O 
efficiency 黎 准 
ELF 


Eliza Eliza 程序 
encapsulation ”封装 
enum 极 举 
ermo 
exceptions ”异常 
extermn 


F 


fall through 

file descriptor ”文件 描述 符 

file pointer 文件 指针 

FILE structure ”FILE 结构 

finite state machine 有限 状态 机 
“一 等 公民 ”类 型 


first-class type 


formal parameter “形式 参数 
Fortran 

Fortran 90 

tp 

frame 框架 

free 

Free Software Foundation 


月 山 软 件 基金 会 
G 


garbage collection。” 垃 坡 收集 

getch 

gets() 

glyph 图 术 符 

gmtime 

GNU 

GNUC 

Golden Rule 人 金 科 坏 律 

2rammar 语法 

Greenwich Mean Time ”格林尼治 标准 时 间 


H 


hack ”hack 程序 

hash ” 散 列 

hash funeiton 散 列 明 数 
hashing “数列 法 

hat layer ” 履 子 屋 

head fjle 头 文件 

heap 堆 

hung 拒 挂 


IBM 
IBM 704 
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IBM PC 

IEEE 

Tiffe vector ltiffe 向 量 
implementation-defined 下 编译 器 定义 的 
jndent indent 程序 

inheritance “ 继 式 

initializer 初始 化 器 
inodes 

instance 实例 
integral promotior 
Intel 

lnte] 80x86 
internationalized ”国际 化 
Internet 


整 型 提升 


Internet worm Internet 煤 虫 
interposing 

interpositioning 

interrupt-driven VO ”中断 驱动 的 IO 
interviews ”和 面试 

ioct] 

10Streanm 

ISO 


J 


Joy, Bi 
K 


K&RC 

kbhit 

kerel 内 核 

Kernighan, Brain 

kludge ”临时 拼凑 的 系统 
Knuth, Donald 

Korn shell 
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Korn. David 
L 


language lawyers 诸 寺 律师 
jare binding 后 期 绕 定 
latency “等待 时 间 

leak ” 洽 汗 

line 行 

linked list ”链表 

linker 链接 纲 

int lint 程序 


Lint Party 

LisP 

iocajity of reference 局 部 引用 
iongjmp 

Ipr 


]-value 。 丰 代 
M 
MAD Magazine MAD 杂志 


magic ”神奇 
mail mail 程序 


Inalloc 

Mariner 

math library ”math 师 数 序 
maximal muneh “最 大 一 局 ”策略 
McNealy, Scott 


member 成 员 

memepy 

memory coruption 内存 损坏 

memory leak ”内存 洪 漏 

memory management 内存 管 理 
memory management unit 内存 管理 单元 
memory map ”内 存 映 射 


288 


memory modeis ”内 存 模 型 
Mercury 

method “方法 

Microsoft 微软 

MIT 脉 省 理工 学 院 

mmap ”mmap 程序 

mmap() 

MMU 内存 管理 单 天 
modifiable -value “可 收 改 的 左 值 
Modula-2 

MS-DOS 

MS-Windows 

Multics 

multidimensional arrays ”多 维 数组 
multiple inheritance “多重 继承 


N 


name space pollution ”各 学 室 间 污染 
namedd pipe ”命名 管道 

NASA 同 家 航空 和 字 寥 航行 局 

naughty device driver 淘气 的 设备 张 动 程序 
New B 

nonblocking read ” 非 阻 塞 式 访 取 

NUL 

NULL 

null pointer assignment ” 空 指 针 值 赋 信 


OQ 


Obfuscated CC 混乱 (代码 ) 

objcct 对象 

object-oriented programming 站 疝 对象 编程 
operator precedence ”操作 符 优先 绕 
optimization 优化 

optimizer 优化 器 


orthogonalfity 下 交 性 
overloading ”和 曹 载 
P 

page fault 页 错 识 
paging 换 页 
palindromes 加 区 
panic ”不 知 所 拱 
parameter ” 形 参 
parity error 奇偶 检验 
Pascal 

PC 

PDP-10 

PDP-1] 

PDP-? 

Pentium “ 作 腾 
Perlis, Alan 

pixel 像素 
Plauger 

PL/I 


pointer to function ”函数 扫 针 
Pointers-to-string ”指向 字符 串 的 指针 
polling 轮 询 
polymorphism ”多 态 
positoin-independent code ”位 置 无 关 代 三 
POSIX 1003,[ 
post-inerement 后缀 自 增 
预 处 理 器 
普林斯顿 大 学 
principle of least astonishment 
则 

printtoo] 

private part ”私有 部 分 
procedure activation record ”过 程 活 动 记录 
procedure linkage table 过程 链 接 表 


preprocessor 
Princeton 


最 小 惊 洲 原 


和 在 序 校 样 
protected mode 保护 模型 
原型 

纯 代 由 


program proofs 


prolotype 
pure code 


R 


锯齿 状 数组 


read-only “只 该 


ragped arrays 


realloc 

register 寄存 路 

reserved ”保留 的 

Teturning an array from a function 
回 一 个 值 

Ritchie, Dennis 

Rochester Institute of Technology 
理工 学 院 

rogue ”rogue 程序 

row major addressing 行 土 序 纲 址 
runtime checking ”运行 时 检查 
mntime System 运行 时 系统 
r-value 右 值 


redefinition 


从 困 数 返 


罗切斯特 


S 


scope resojution opcrator ”范围 分 解 柑 作 符 
segment 段 
segmentation fault 段 错误 
segments 分 段 

sending a messuge 发 送信 息 
Setjmp 
shared object 


Signal handler 


共 水 对 银 
signal 
信和 号 处 型 块 


signal handling 信号 处 理 
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Simula-67 

sizeof 

snoop snoop 程序 

space Shuttle 太空 飞扬 

space software ”太空 软件 
SPARCserver 1000 

SPARCstation 2 

stack ”堆栈 

stack frame ”堆栈 结构 

stack segment 堆栈 段 

stack size ”堆栈 长 度 

Stallman, Richard 

Stanford University ”斯坦福 大 学 
static . 

static linking ”静态 链接 
存储 类 型 

存储 类 型 说 基 符 


stordge-class 
storapge-class specifier 
stream pointer ” 流 指针 
STREAMS 
strictly-conforming 淘 格 遵循 
strings strings 程序 

stty stty 程序 
subscript operator 下 标 操 作 符 
subscripted array parameter 带 下 标的 数组 
参数 
SVr4 
swap ”交换 

swap space ”交换 区 
symbol table ”符号 表 


T 


tag 标签 
template ”模板 


文本 段 


terminal 


text segment 
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Thompson, Ken 
threads ”线程 
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time_t 

tools ”工具 程序 
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traditional recursion joke ”传统 的 递归 款 笑 
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XX 
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